新浪微博大数据实习生面试问题分享 -2013年

今天应该说是自己人生中第一次正式面试,虽然这几天来一直在准备,但是还是被虐的很惨,最后结果还好。

总结一下被问到的问题吧:

1.以前参加的竞赛,主要完成的是什么功能,你负责的是哪一个模块,怎么实现的;

2.给100M数据,对里面的单词统计词频我说了个用hashMap方法,但是面试官说效率不高,然后我就没想出来了。

3.怎么对100M的单词进行排序我说了个快排,但显然不是面试官想要的答案,然后又说用ASCII码,但是我就不知道怎么实现了,后来说了个基数排序,然后被问时间复杂度,但感觉还不是他要的答案。

4.中文分词怎么实现我说在《数学之美》曾经看到过,实在想不起来了。

5.自己构造一个分类器,需要把互联网上所有的网页内容都抓取下来,怎么高效实现我说的是可以用pagelink,然后问说该算法的实现方式,然后面试官问还没有更高效的。

6.对《集体智慧编程》最有印象的是哪一章?讲讲具体实现协同过滤

7.写一个简单程序:字符串逆置。

总结:自己对一些东西只是知道一些皮毛,从来没有更深入的想过怎么优化,以后还是踏踏实实的深入学习吧。
先搜搜上面这些问题的最佳解决方案。


个人资料
Bingo
等级:9
文章:694篇
访问:38.9w
排名: 1
推荐
欢迎关注 “BAT笔试面试” 微信公众号
全栈面试题,你想要的都在这^_^
上一篇: 新浪微博推荐工程师面试分享-2014年
下一篇:新浪校园招聘笔试题-2014年
猜你感兴趣的圈子:
新浪笔试面试圈
标签: 100m、面试官、这几天来、pagelink、问说、面试题