一、单选题
1、以下关于经典的k-means聚类的说法哪个是错误的?
A、k-means聚类算法是全局收敛的
B、k-means的聚类结果和初始聚类中心点的选取有关
C、k-means聚类算法的时间复杂度是O(NKT),其中N为样本个数,K为聚类团数量,T为迭代次数
D、k-means聚类算法无法自动确定聚类团数量
2、以下两种描述分别对应哪两种对分类算法的评价标准?
① 美团推荐的餐厅有多少是用户喜欢的
② 用户喜欢的餐厅有多少被美团推荐了
A、Precision, Recall
B、Recall, Precision
C、Precision, AUC
D、Recall, AUC
3、假定一个二维数组的定义语句为“int a[3][4]={{3,9},{2,8,5}};”,则元素a[1][2]的值为
A、5
B、4
C、2
D、8
4、快速排序的最坏时间复杂度是?
A、O(lgN)
B、O(N)
C、O(NlogN)
D、O(N*N)
5、HMM的无监督训练方法是?
A、EM算法
B、viterbi算法
C、前向-后向算法
D、梯度下降算法
6、下面那个不是序列标注模型?
A、HMM
B、ME(最大熵)
C、MEMM
D、CRF
7、下列说正确的是?
A、回归函数A和B,如果A比B更简单,则A几乎一定会比B在测试集上表现更好
B、梯度下降有时会陷于局部极小值,但EM算法不会
C、在AdaBoost算法中,所有被错分的样本的权重更新比例相同
D、当训练数据较少时更难发生过拟合
8、逻辑回归的损失函数是?
A、log对数损失函数
B、平方损失函数
C、指数损失函数
D、Hinge损失函数
E、0-1损失函数
9、如下表是用户是否使用某产品的调查结果。
UID 性别 地区 学历 收入 用户是否使用调查产品
1 男 北方 博士 低 是
2 女 北方 本科 中 否
3 男 南方 本科 高 否
4 女 北方 研究生 中 是
请计算性别、地区、学历、收入中对用户是否使用调查产品信息增益最大的属性。(Log23≈0.63)
A、性别
B、地区
C、学历
D、收入
10、美团点评是大家吃喝玩乐的生活好帮手: 比如大家搜索”7天连锁酒店”,会返回一系列相关的结果。如果要识别这句话的商家核心词-“7天”,以下哪种方法识别商家核心词准确率最低,不能直接使用?
A、通过分析用户搜索日志,人工制定模板或规则来识别
B、标注一些数据,抽取特征,用CRF训练出模型来识别
C、使用word2vec训练词向量,对词聚类,根据词属于的类别来识别
D、人工整理商家核心词词表,按是否命中词表里的词来识别
二、多选题
11、以下哪些主要用于无监督的深度学习网络
A、Restricted Boltzmann Machines
B、AutoEncoder
C、Deep Belief Networks
D、Recurrent Neural Network
12、同事去美团上班,自己开车,滴滴拼车,滴滴快车,骑滑板车的概率分别是0.3,0.2,0.1,0.4,各种方式迟到的概率分别1/4,1/3,1/12,0,下列语句中正
确的是
A、如果他准点,那么骑滑板车的概率大于等于0.5
B、单人出行(自己开车或者滴滴快车)准点机会比滴滴拼车要低
C、如果他迟到,自己开车的概率是0.5
D、如果他准点,使用滴滴的概率等于自己开车的概率
13、设有一个栈,元素一次进栈的顺序是A,B,C,D,E。下列可能的出栈顺序有?
A、ABCED
B、EABCD
C、BCDAE
D、EDCBA
14、机器学习中能够用于指导特征选择的指标
A、信息增益
B、信息增益率
C、基尼系数
D、信息熵
15、使用协同过滤做电影推荐,使系统可以对新用户输出结果的操作是:
A、使用内容特征计算电影之间的相似度
B、增加更长时间的训练数据
C、使用电影点击之外的数据计算用户相似度,例如用户背景信息
D、使用热门电影推荐结果补充个性化推荐结果
参考答案
一、单选题
1、A 2、A 3、A 4、D 5、A 6、B 7、C 8、A 9、C 10、C
二、多选题
11、ABC 12、CD 13、ACD 14、ABCD 15、CD