1、什么情况下用指数函数拟合数据?(背景是想用指数函数拟合CTR与展示次数的关系,不知道这样子合适不?)
2、选择userCF与itemCF需要考虑的因素?
答:
3、logistic回归的目标函数是什么。(先询问了知道哪些ML算法,然后面试官挑了LR来问)
答:写的是tagert与hypothesis的最小二乘形式。还被面试官确认了一下“最小二乘”,随后被问似然函数是什么?现在想来,应该回答最小二乘形式等价于最大似然,在样本独立同分布的情况下。将logistic回归放在GLM框架中讲时,应该将框架的三条要求写完整,用该框架介绍logistic回归,然后介绍多元logistic回归。
4、询问的问题:微博中间的“好友关注”推荐与右侧的“可能感兴趣的人”推荐有什么区别?
答:中间是属于用户的空间,所做推荐更偏重于社交关系,很有可能是已经认识的,或者同一学校、同一工程的。右边的是商业空间,所做推荐可能更偏重兴趣。
5、了解哪些优化算法?
答:梯度下降、牛顿。对regulation了解不?知道,但讲不清楚。
6、推荐系统做什么事情?
答:将用户感兴趣的、但目前不知道的物品推荐给他。后续的问题是:怎么衡量用户不知道?怎么衡量用户感兴趣? 这个问题当时回答的不好。前者可以用物品的点击次数衡量,如果被所有人点击的次数的综合较少,则用户很有有可能不知道。后者:和某用户有相似行为的其他人感兴趣,则该用户也可能感兴趣。
今天面试时的不足:
1、没有将对LDA的了解提出来。
2、第二次被问到优化算法,要准备一下。