申请加入>
订阅>
Spark性能优化指南——高级篇
作者:
degnziming
2019-01-29
继基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark性能优化指南》的高级篇,将深入分析数据倾斜调优与shuffle调优,以解决更加棘手的性能问题。调优概述有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解决不...
Spark性能优化指南——基础篇
作者:
degnziming
2019-01-29
在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作,应用范围与前景非常广泛。在美团•大众点评,已经有很多同学在各种项目中尝试使用Spark。大多数同学(包括笔者在内),最初开始尝试使用Spark的...
网站日志分析项目从架构到实现
作者:
degnziming
2019-01-28
项目简介:大数据涉及到的业务很多很复杂,从一开始的项目架构,再到后台的网站搭建,以及数据的收集,数据的分析,数据的迁移,业务开发,后台运维,等等。我们没办法一个实验将所有的过程都学习到。本次试验我们将会将重点放在项目架构上,后面的项目我们将重点放在每一部分的实现上。通过本次实验,你将能了解到一个大数据架构师工作的基本步骤,虽然本次实验我们...
复习两个月拿到阿里offer,Java面试复习思路分享
作者:
degnziming
2019-01-17
作者刘欣来源微信公众号号码农翻身链接https://mp.weixin.qq.com/s/J-HVQnDp9fOqQnxaythsog去年的这个时候我通过两个月的复习拿到了阿里巴巴的offer,有一些运气,也有一些心得,借着跳槽季来临特此分享出来。简单梳理一下我的复习思路,同时也希望和大家一起交流讨论,一起学习,如果不对之处欢迎指正一起学...
我是Java,这是我的2018年总结
作者:
degnziming
2019-01-16
作者刘欣来源微信公众号号码农翻身链接https://mp.weixin.qq.com/s/Nv1Ytm2tTVsh-BuS6XP7OQ我是你们热爱的Java,2018年过去了,我给你们总结一下这一年发生在我身上的大事。开始之前,先提醒一下大家,我的Oracle后爸从2019年1月起要对JDK8的update收费了,详情可见老刘写的这篇文章...