4
K
6
K
首页
圈子
笔试面试▽
面试题
技术论坛
笔试题
在线编程
技能提升▽
IT精选文章
IT技术馆
IT图书馆
IT公司
IT导航
IT文章
IT教程
更多▽
资源大厅
小工具
问题反馈
注册
登录
Hive分区表和分桶表的区别
hdfs文件个数:
分桶的数量是在创建表时指定的,数量不能更改。如果要更改数量,需要重新插入数据。
分区的数量是根据字段枚举值的个数决定的,系统决定的,分区个数是动态增长的。
作用:
分区:是用于提高查询效率(避免扫描整个表,只需要扫描相关部分即可。例如日志文件可以按日期天分区,每天一个分区)
分桶:提高join查询效率,方便抽样
值:
分区中的每条数据中的分区字段值都是完全相同的
分桶中的每条数据的分桶字段值余上分桶数量的结构都是一样的。即分桶中的每个分桶字段值都不一样。
标签: 分桶、分区、段值、数量、每条、面试
取消
回复
推荐
面试题
笔试题
内推
IT导航
精选IT书籍
举报内容
验证码:
账 号:
密 码:
验证码:
记住密码
注册
忘记密码
Copyright © 2014-2024 k6k4.com 版权所有
浙公网安备 33010602006230号
浙ICP备14015892号
隐藏