新浪微博推荐工程师面试分享-2014年

1、什么情况下用指数函数拟合数据?(背景是想用指数函数拟合CTR与展示次数的关系,不知道这样子合适不?)
2、选择userCF与itemCF需要考虑的因素?
答:

  • 数据稀疏性。使用userCF要求用户相似度矩阵较稠密,使用itemCF要求物品相似度矩阵较稠密;
  • (用户与)物品更新频率。若物品更新特别快,则itemCF维护物品相似度矩阵成本较大;
  • 对个性化和实时性的要求。userCF反映的是某一兴趣相同群体的热点,实时性较好,个性化不足。
    itemCF根据用户历史行为进行推荐,比较个性化。
  • 解释性。itemCF可以解释,userCF难以解释。

3、logistic回归的目标函数是什么。(先询问了知道哪些ML算法,然后面试官挑了LR来问)
答:写的是tagert与hypothesis的最小二乘形式。还被面试官确认了一下“最小二乘”,随后被问似然函数是什么?现在想来,应该回答最小二乘形式等价于最大似然,在样本独立同分布的情况下。将logistic回归放在GLM框架中讲时,应该将框架的三条要求写完整,用该框架介绍logistic回归,然后介绍多元logistic回归。
4、询问的问题:微博中间的“好友关注”推荐与右侧的“可能感兴趣的人”推荐有什么区别?
答:中间是属于用户的空间,所做推荐更偏重于社交关系,很有可能是已经认识的,或者同一学校、同一工程的。右边的是商业空间,所做推荐可能更偏重兴趣。
5、了解哪些优化算法?
答:梯度下降、牛顿。对regulation了解不?知道,但讲不清楚。
6、推荐系统做什么事情?
答:将用户感兴趣的、但目前不知道的物品推荐给他。后续的问题是:怎么衡量用户不知道?怎么衡量用户感兴趣? 这个问题当时回答的不好。前者可以用物品的点击次数衡量,如果被所有人点击的次数的综合较少,则用户很有有可能不知道。后者:和某用户有相似行为的其他人感兴趣,则该用户也可能感兴趣。
今天面试时的不足:
1、没有将对LDA的了解提出来。
2、第二次被问到优化算法,要准备一下。


个人资料
Bingo
等级:9
文章:694篇
访问:38.9w
排名: 1
上一篇: 新浪云计算开发面经分享 -2013年
下一篇:新浪微博大数据实习生面试问题分享 -2013年
猜你感兴趣的圈子:
新浪笔试面试圈
标签: itemcf、物品、usercf、logistic、二乘、面试题
隐藏