美团算法工程师笔试题-2016年

一、单选题

1、以下关于经典的k-means聚类的说法哪个是错误的?

A、k-means聚类算法是全局收敛的

B、k-means的聚类结果和初始聚类中心点的选取有关

C、k-means聚类算法的时间复杂度是O(NKT),其中N为样本个数,K为聚类团数量,T为迭代次数

D、k-means聚类算法无法自动确定聚类团数量

2、以下两种描述分别对应哪两种对分类算法的评价标准?
① 美团推荐的餐厅有多少是用户喜欢的
② 用户喜欢的餐厅有多少被美团推荐了

A、Precision,  Recall

B、Recall,  Precision

C、Precision,  AUC

D、Recall,  AUC

3、假定一个二维数组的定义语句为“int a[3][4]={{3,9},{2,8,5}};”,则元素a[1][2]的值为

A、5

B、4

C、2

D、8

4、快速排序的最坏时间复杂度是?

A、O(lgN)

B、O(N)

C、O(NlogN)

D、O(N*N)

5、HMM的无监督训练方法是?

A、EM算法

B、viterbi算法

C、前向-后向算法

D、梯度下降算法

6、下面那个不是序列标注模型?

A、HMM

B、ME(最大熵)

C、MEMM

D、CRF

7、下列说正确的是?

A、回归函数A和B,如果A比B更简单,则A几乎一定会比B在测试集上表现更好

B、梯度下降有时会陷于局部极小值,但EM算法不会

C、在AdaBoost算法中,所有被错分的样本的权重更新比例相同

D、当训练数据较少时更难发生过拟合

8、逻辑回归的损失函数是?

A、log对数损失函数

B、平方损失函数

C、指数损失函数

D、Hinge损失函数

E、0-1损失函数

9、如下表是用户是否使用某产品的调查结果。
UID 性别 地区 学历 收入 用户是否使用调查产品
1 男 北方 博士 低 是
2 女 北方 本科 中 否
3 男 南方 本科 高 否
4 女 北方 研究生 中 是
请计算性别、地区、学历、收入中对用户是否使用调查产品信息增益最大的属性。(Log23≈0.63)

A、性别

B、地区

C、学历

D、收入

10、美团点评是大家吃喝玩乐的生活好帮手: 比如大家搜索”7天连锁酒店”,会返回一系列相关的结果。如果要识别这句话的商家核心词-“7天”,以下哪种方法识别商家核心词准确率最低,不能直接使用?

A、通过分析用户搜索日志,人工制定模板或规则来识别

B、标注一些数据,抽取特征,用CRF训练出模型来识别

C、使用word2vec训练词向量,对词聚类,根据词属于的类别来识别

D、人工整理商家核心词词表,按是否命中词表里的词来识别

二、多选题

11、以下哪些主要用于无监督的深度学习网络

A、Restricted Boltzmann Machines

B、AutoEncoder

C、Deep Belief Networks

D、Recurrent Neural Network

12、同事去美团上班,自己开车,滴滴拼车,滴滴快车,骑滑板车的概率分别是0.3,0.2,0.1,0.4,各种方式迟到的概率分别1/4,1/3,1/12,0,下列语句中正
确的是

A、如果他准点,那么骑滑板车的概率大于等于0.5

B、单人出行(自己开车或者滴滴快车)准点机会比滴滴拼车要低

C、如果他迟到,自己开车的概率是0.5

D、如果他准点,使用滴滴的概率等于自己开车的概率

13、设有一个栈,元素一次进栈的顺序是A,B,C,D,E。下列可能的出栈顺序有?

A、ABCED

B、EABCD

C、BCDAE

D、EDCBA

14、机器学习中能够用于指导特征选择的指标

A、信息增益

B、信息增益率

C、基尼系数

D、信息熵

15、使用协同过滤做电影推荐,使系统可以对新用户输出结果的操作是:

A、使用内容特征计算电影之间的相似度

B、增加更长时间的训练数据

C、使用电影点击之外的数据计算用户相似度,例如用户背景信息

D、使用热门电影推荐结果补充个性化推荐结果

参考答案

一、单选题

1、A  2、A  3、A  4、D  5、A  6、B  7、C  8、A  9、C  10、C

二、多选题

11、ABC  12、CD  13、ACD  14、ABCD  15、CD

个人资料
游弋的蔷薇
等级:7
文章:27篇
访问:3.8w
排名: 10
上一篇: 美团运维工程师笔试题-2016年
下一篇:京东研发类面试题-2012年
猜你感兴趣的圈子:
美团笔试面试圈
标签: 聚类、开车、means、损失、北方、面试题
隐藏