新浪微博推荐工程师面试分享-2014年 -k6k4.com

1、什么情况下用指数函数拟合数据？（背景是想用指数函数拟合CTR与展示次数的关系，不知道这样子合适不？）
2、选择userCF与itemCF需要考虑的因素？
答：

数据稀疏性。使用userCF要求用户相似度矩阵较稠密，使用itemCF要求物品相似度矩阵较稠密；
（用户与）物品更新频率。若物品更新特别快，则itemCF维护物品相似度矩阵成本较大；
对个性化和实时性的要求。userCF反映的是某一兴趣相同群体的热点，实时性较好，个性化不足。
itemCF根据用户历史行为进行推荐，比较个性化。
解释性。itemCF可以解释，userCF难以解释。

3、logistic回归的目标函数是什么。（先询问了知道哪些ML算法，然后面试官挑了LR来问）
答：写的是tagert与hypothesis的最小二乘形式。还被面试官确认了一下“最小二乘”，随后被问似然函数是什么？现在想来，应该回答最小二乘形式等价于最大似然，在样本独立同分布的情况下。将logistic回归放在GLM框架中讲时，应该将框架的三条要求写完整，用该框架介绍logistic回归，然后介绍多元logistic回归。
4、询问的问题：微博中间的“好友关注”推荐与右侧的“可能感兴趣的人”推荐有什么区别？
答：中间是属于用户的空间，所做推荐更偏重于社交关系，很有可能是已经认识的，或者同一学校、同一工程的。右边的是商业空间，所做推荐可能更偏重兴趣。
5、了解哪些优化算法？
答：梯度下降、牛顿。对regulation了解不？知道，但讲不清楚。
6、推荐系统做什么事情？
答：将用户感兴趣的、但目前不知道的物品推荐给他。后续的问题是：怎么衡量用户不知道？怎么衡量用户感兴趣？这个问题当时回答的不好。前者可以用物品的点击次数衡量，如果被所有人点击的次数的综合较少，则用户很有有可能不知道。后者：和某用户有相似行为的其他人感兴趣，则该用户也可能感兴趣。
今天面试时的不足：
1、没有将对LDA的了解提出来。
2、第二次被问到优化算法，要准备一下。

个人资料

Bingo
等级：9
文章：694篇
访问：38.9w
排名： 1

推荐圈子

新浪笔试面试圈