set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat; 解决 map 端的小文件进行合并
set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat; 解决 map 端的小文件进行合并
·
ods 层数据装载到 dim 层数据,出现 NULL 异常数据
原因:ods 层数据有 lzo文件的index索引文件,map端小文件合并把lzo的索引文件也给合并了,所以hive数据查询出现 NULL 异常数据
- 查看hive默认数据存储格式
set hive.input.format;
默认是: org.apache.hadoop.hive.ql.io.CombineHiveInputFormat会对 map 端的小文件进行合并
- 修改hive默认数据存储格式
所以需要修改为 org.apache.hadoop.hive.ql.io.HiveInputFormat
set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat;
更多推荐
所有评论(0)