百度校招机器学习/数据挖掘笔试题-2015年

一  简单题(本题共30分)

1. (10分) 如何理解继承、多态、组合,请举例说明它们的应用。

2. (10分) 请列举出进程间通信的几种方式(至少列举三种)。

3. (10分) 请写出贝叶斯公式,请描述朴素贝叶斯分类方法的原理和步骤。

二  算法与程序设计(本题共40分)

1. (20分) 两个长度为100的随机向量X和Y,X=(x1,x2,x3,……,xn),Y=(y1,y2,y3,……,yn),其中xi和yi都是从均值为0,标准差为1的正态分布中随机选择的数,随机变量Z为X和Y的相关系数,请问:(1)Z的期望和标准差是多少?请简单给出推导公式。(2)请用蒙特卡洛方法模拟,写代码计算Z的期望和标准差。

2. (20分) 假设张三的mp3里有1000首歌,现在希望设计一种随机算法来随机播放。与普通随机模式不同的是,张三希望每首歌被随机到的概率是与一首歌的豆瓣评分(0~10分)成正比的,如朴树的《平凡之路》评分为8.9分,逃跑计划的《夜空中最亮的星》评分为9.5分,则希望听《平凡之路》的概率与《夜空中最亮的星》的概率比为89:95。现在我们已知这1000首歌的豆瓣评分:(1)请设计一种随机算法来满足张三的需求。(2)写代码实现自己的算法。

三  系统设计题(本题共30分)

1. (30分) 我们对一批一维数组进行回归拟合,给定训练数据集D = (xi, yi) ,i = 1……n,其中xi∈R是一个实数,yi∈R是xi对应的回归目标。我们拟使用线性,二次,高次函数对yi进行拟合:线性函数:f(x) = ax+b二次函数:f(x) = ax2+bx+c三次函数:f(x) = ax3+bx2+cx+d…(1)我们设定最小均方误差为损失函数,请写出损失函数的具体形式。(2)以二次函数拟合为例,请使用随机梯度下降(stochastic gradient decent)对损失函数进行优化,给出参数a,b,c的梯度推导并写出算法。(3)下面三图分别是一次函数,二次函数,七次函数拟合的结果,同时给出它们在D上损失函数值依次是:0.76,0.15,0.01。在选择用什么函数作为最终拟合函数的时候,你会有哪些考虑。本例中你会选择那个函数。

个人资料
Bingo
等级:9
文章:694篇
访问:38.9w
排名: 1
上一篇: 阿里巴巴研发工程师校招笔试题-2016年
下一篇:奇虎360校园招聘技术类笔试题目-2015年
猜你感兴趣的圈子:
百度笔试面试圈
标签: yi、xi、二次、评分、随机、面试题
隐藏