一、问题描述:

HDP3.0 集成了hive 3.0和 spark 2.3,然而spark却读取不了hive表的数据内容,准确来说是内表的数据。

二、原因:

hive 3.0之后默认开启ACID功能,而且新建的表默认是ACID表。而spark目前还不支持hive的ACID功能,因此无法读取ACID表的数据. 

三、解决办法:

 修改以下参数让新建的表默认不是acid表。 
      hive.strict.managed.tables=false 
      hive.create.as.insert.only=false 
      metastore.create.as.acid=false
 

参考链接:https://blog.csdn.net/u013024563/article/details/81567849

参考链接:https://issues.apache.org/jira/browse/SPARK-15348

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐