有关往年百度笔试真题.doc

资源描述

《有关往年百度笔试真题.doc》由会员分享，可在线阅读，更多相关《有关往年百度笔试真题.doc（6页珍藏版）》请在三一办公上搜索。

1、有关往年百度笔试真题往年百度笔试真题一，简答题(本题共30分)1. 当前计算机系统一般会采用层次结构来存储数据，请介绍下典型的计算机存储系统一般分为哪几个层次，为什么采用分层存储数据能有效提高程序的执行效率?(10分)2. Unix/Linux系统的僵尸进程是如何产生的?有什么危害?如何避免?(10)3. 简述Unix/Linux系统中使用socket库编写服务器程序的流程，请分别用对应的socket通信函数表示。二，算法与程序设计题(本题共45分)1，使用C/C+语言写一个函数，实现字符串的反转，要求不能用任何系统函数，且时间复杂度最小。函数原型是：char _reverse_str(c

2、har _str)(15分)2，给定一个如下输入格式的字符串，(1，(2，3)，(4，(5，6)，7)括号内的元素可以是数字，也可以另一个括号，请实现一个算法消除嵌套的括号。比如把上面的表达式变成：(1，2，3，4，5，6，7)，如果表达式有误请报错。(15分)3，相似度计算用于衡量对象之间的相似程度，在数据挖据，自然语言处理中使一个基础性计算，在广告检索服务中往往也会判断网民检索Query和广告Adword的主题相似度。假设Query或者Adword的主题属性定义为一个长度为10000的浮点数据Pr10000(称之为主题概率数组)，其中Pri表示Query或者Adword属于主题Id为i

3、的概率，而Query和Adword的相似度简化定义为两者主题概率数组的内积，即sim(Query,Adword)=sum(QueryPri_AdwordPri)(0=i10000).在实际应用场景中，由于大多数主题的概率都为0，所以主题概率数组往往比较稀疏，在实现时会以一个紧凑型数组topic_info_t的方式保存，其中100=数组大小=1000，并按照topic_id递增排列，0=topic_id10000,0现在给出Query的topic_info_t数组和N(N=5000)个Adwords的 topic_info-t数组，现要求出Query与Adwords的相似度最大值，即max(si

4、m(Query,Adwordi)(0=i query_topic_info, Const vector adwords_topic_info, Int adwords_number);编写代码求时间复杂度最低的算法，并给出时间复杂度分析。(15分)三，系统设计题(本题共25分)在企业中，对生产数据进行分析具有很重要的意义。但是生产数据通常不能直接用于数据分析，通常需要进行抽取，转换和加载，也就是业界常识的ETL历年百度笔试题一，简答题(本题共30分)1. 当前计算机系统一般会采用层次结构来存储数据，请介绍下典型的计算机存储系统一般分为哪几个层次，为什么采用分层存储数据能有效提高程序的执行效率?

5、(10分)2. Unix/Linux系统的僵尸进程是如何产生的?有什么危害?如何避免?(10)3. 简述Unix/Linux系统中使用socket库编写服务器程序的流程，请分别用对应的socket通信函数表示。二，算法与程序设计题(本题共45分)1，使用C/C+语言写一个函数，实现字符串的反转，要求不能用任何系统函数，且时间复杂度最小。函数原型是：char _reverse_str(char _str)(15分)2，给定一个如下输入格式的字符串，(1，(2，3)，(4，(5，6)，7)括号内的元素可以是数字，也可以另一个括号，请实现一个算法消除嵌套的括号。比如把上面的表达式变成：(1，2，

6、3，4，5，6，7)，如果表达式有误请报错。(15分)3，相似度计算用于衡量对象之间的相似程度，在数据挖据，自然语言处理中使一个基础性计算，在广告检索服务中往往也会判断网民检索Query和广告Adword的主题相似度。假设Query或者Adword的主题属性定义为一个长度为10000的浮点数据Pr10000(称之为主题概率数组)，其中Pri表示Query或者Adword属于主题Id为i的概率，而Query和Adword的相似度简化定义为两者主题概率数组的内积，即sim(Query,Adword)=sum(QueryPri_AdwordPri)(0=i10000).在实际应用场景中，由于大多数

7、主题的概率都为0，所以主题概率数组往往比较稀疏，在实现时会以一个紧凑型数组topic_info_t的方式保存，其中100=数组大小=1000，并按照topic_id递增排列，0=topic_id10000,0现在给出Query的topic_info_t数组和N(N=5000)个Adwords的 topic_info-t数组，现要求出Query与Adwords的相似度最大值，即max(sim(Query,Adwordi)(0=i query_topic_info, Const vector adwords_topic_info, Int adwords_number);编写代码求时间复杂度最低的

8、算法，并给出时间复杂度分析。(15分)三，系统设计题(本题共25分)在企业中，对生产数据进行分析具有很重要的意义。但是生产数据通常不能直接用于数据分析，通常需要进行抽取，转换和加载，也就是业界常识的ETL往年腾讯笔试题目及答案1. 1-20的两个数把和告诉A,积告诉B，A说不知道是多少，B也说不知道，这时A说我知道了，B接着说我也知道了，问这两个数是多少?答案：2和32 爸爸,妈妈,妹妹,小强,至少两个人同一生肖的概率是多少?1-12_11_10_9/12_12_12_12 = 1-55/96 = 41/963, 计算 ab 2答案：运算符优先级：括号，下标，-和.(成员)最高;单目的比双目的

9、高;算术双目的比其他双目的高;位运算高于关系运算;关系运算高于按位运算(与，或，异或);按位运算高于逻辑运算;三目的只有一个条件运算，低于逻辑运算;赋值运算仅比 , (顺序运算)高。在此题中，位左移” 优先级高于按位异或”,所以b先左移两位(相当于乘以4)，再与a异或。例如：当 a = 6; b = 4 时; 则 ab2 = 224 如何输出源文件的标题和目前执行行的行数?答案： printf(”The file name: %dn”, _FILE_);printf(”The current line No:%dn”, _LINE_);ANSI C标准预定义宏:_LINE_FI

10、LE_DATE_TIME_STDC_ 当要求程序严格遵循ANSI C标准时该标识符被赋值为1_cplusplus_ 当编写C+程序时该标识符被定义5 a34哪个不能表示 a11: _(a00+5) _(_(a+1)+1) _(a1+1) _(a00+4)答案: _(a1+1)a是数组的首地址，a1就表示a10地址了，不用再取地址了。6 fun(exp1,exp2),(exp3,exp4,exp5)有几个实参?答案：两个。形式参数：在声明和定义函数时，写在函数名后的括号中的参数。实参是调用参数中的变量，行参是被调用函数中的变量。7. 希尔冒泡快速插入哪个平均速度最快?答案：快速排序快速排

11、序、归并排序和基数排序在不同情况下都是最快最有用的。8. enum的声明方式答案：enum 枚举类型名枚举常量1，枚举常量2，枚举常量n;For example:enum weekday sunday, monday, tuesday, wednesday, thursday, friday, saturday;enum weekday week_day;/week_day 就是一个枚举类型变量9. 频繁的插入删除操作使用什么结构比较合适，链表还是数组?答案：链表10. _p=NULL _p=new char100 sizeof(p)各为多少?答案：都为4。因为都是指针类型，所占存储空间必然

12、为4。11. 顺序查找的平均时间答案：(1+2+3+n)/n = (n+1)/212. for(i=0,sum=0; i10; +i,sum+=i);的运行结果答案：sum = 5513. 不能做switch()的参数类型是：答案：switch的参数不能为浮点型。14.不使用其他变量，交换两个整型a，b的值答案：x = x+y; y = x-y; x = x-y15. 写出float x 与“零值”比较的if语句。if(x=0.000001 x=-0.000001)(x不为0的比较)float: 6位精度double: 16位精度16. 有个表tableQQ，有整型的ID项和字符类型的Nick

13、name项，这两个项都不允许为空(1)写出建立该表的SQL语句(2)找出Nickname为QQ的用户，按ID降序排列的SQL语句(3)写出删除ID为1234用户记录的SQL语句(4)写出添加ID为5555，Nickname为1234的SQL语句答案：(1) CREATE TABLE tableQQ(ID NUMBER(12) NOT NULL,Nickname Varchar2(30) NOT NULL);(2) select _ from tableQQ where Nickname = QQ order by ID desc;(3) delete from tableQQ where (4) insert into tableQQ values(5555,1234);

展开阅读全文