唯品会南京站数据挖掘与分析岗位笔试题目-2014年

一、编程和算法题

1、给定字符串,以及一个字典,判断字符串是否能够拆分为字段中的单词。例如,字段为{hello,world},字符串为hellohelloworld,则字符串可以拆分为hello,hello,world

2、给定字符串,可以通过插入字符,使其变为回文。求最少插入字符的数量。例如,ab最少插入一个字符,变为bab;aa最少插入0个字符;abcd最少插入3个字符,dcbabcd

3、请用你熟悉的语言,分析出以下sql中包含了哪些表,哪些用户名?

select t3.name from
(
    sellect a.id, b.name from user1.t1 a, user2.t2 b
    where a.id=b.id
) c
join t3
on(c.id=t3.id);

4、如果让你设计一个用户登录系统,你会如何设计?

5、给定软件的版本号的表达方式,以及一些版本号,请找出最新的版本。例如:1.2, 2.2最新的是2.2;3.1,3.1.3最新的是3.1.3。上面的版本号,都是用字符串表示的。

二、分布式计算

1、你是否听说过hadoop/mapreduce?如果有,请描述一下你对于它们的理解。

2、给你100台服务器,以及一个10亿行记录的文件,文件中都是数字类型的用户id。如何最快的算出这些文件中的top 100的userid。

三、数据库

1、你有听说过key-value数据库吗?谈谈你的理解。

2、是否用过oracle或者mysql数据库?索引在这两个数据库中的作用是什么?能否举几个例子。

3、如果在4亿条记录里面有完全重复的记录,该怎样剔除?你想到了多少种方法?你认为哪种是比较好的?请说出你的理由!

4、数据库有3张表:

  • 学生表Student(sno int, gno int, sname varchar, sex varchar),其中sno,gno,sname,sex分别表示学生编号,班级编号,学生姓名,性别
  • 学生成绩表Score(date date, sno int, cno int, score numeric),其中date,sno,cno,score分别表示考试日期,学生编号,科目,成绩
  • 科目表course(cno int, cname varchar),其中cno,cname分别表示科目,科目名称

请写一个SQL,在2011-6-6号到2011-6-8号期间,数学成绩在该班的排名为前3名,且总分高于该班总分平均分的学生姓名,以及该学生在该学校的总排名。

四、运维

1、是否接触过unix/linux系统?

2、这些系统中,查看内存大小的命令你知道哪些?

3、dns你是否知道?知道他的简单工作机制吗?

五、网站

1、你常用的网站有哪些?你能否估计一下这些网站每天的访问量?

2、这些网站在功能、界面上,是否有让觉得特别满意或者特别不满意的地方?

3、SNS网站(校内,微博,微信)上有各种各样的信息,你觉得这些信息能够在哪些方面帮助到我们网站(www.vipshop.com 电商特卖类型)?


个人资料
Bingo
等级:9
文章:694篇
访问:38.9w
排名: 1
推荐
欢迎关注 “BAT笔试面试” 微信公众号
全栈面试题,你想要的都在这^_^
上一篇: 唯品会校招运维笔试题-2014年
下一篇:唯品会前端面经-2017年
猜你感兴趣的圈子:
唯品会笔试面试圈
标签: 学生、cno、sno、科目、t3、面试题