1、DataFrame 除了数据以外,还记录数据的结构信息,即schema
2、RDD倾向于创建大量临时对象,对GC造成压力,Spark SQL 会复用对象
3、Spark SQL 会做优化,如:谓词下推、列裁剪
浙公网安备 33010602006230号
浙ICP备14015892号