(1)cache和persist都是用于将一个RDD进行缓存的,这样在之后使用的过程中就不需要重新计算了,可以大大节省程序运行时间;
(2)cache只有一个默认的缓存级别MEMORY_ONLY ,cache调用了persist,而persist可以根据情况设置其它的缓存级别;
(3)executor执行的时候,默认60%做cache,40%做task操作,persist最根本的函数,最底层的函数
下一题:谈谈spark中的宽窄依赖
标签: persist、cache、缓存、级别、pesist
笔试题
刷题
简历模板
AI算法
大数据
内推
内推: