cover

配置hive on spark

linux虚拟机配置Spark On Hive

空白格2519

690人浏览 · 2023-03-15 14:55:52

空白格2519 · 2023-03-15 14:55:52 发布

配置hive on spark

1、上传 Spark 纯净版 jar 包到 HDFS：

hdfs dfs -mkdir /spark-jars

hdfs dfs -put /opt/spark/jars/* /spark-jars

2、修改 hive-site.xml 文件，添加如下配置：

    <!--Spark 依赖位置（注意：端口号必须和 namenode的端口号一致）-->
    <property>
     	<name>spark.yarn.jars</name>
     	<!--<value>hdfs://hadoop:8020/spark-jars/*</value>-->
    <value>hdfs://hadoop:9000/spark-jars/*</value>
    </property>
    <!--Hive 执行引擎-->
    <property>
     	<name>hive.execution.engine</name>
     	<value>spark</value>
    </property>
    <!--Hive 和 Spark 连接超时时间-->
    <property>
     	<name>hive.spark.client.connect.timeout</name>
     	<value>10000ms</value>
    </property>

2、测试hive on spark是否配置成功。

往数据库表default.student中添加数据：insert into student values(‘haoge’,22);

本文仅用于参考学习，参考原文：
https://blog.csdn.net/weixin_45417821/article/details/115268740

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

cover

动物识别系统 python实现+UI

腾讯云开发者社区

Linux下安装MySQL8.0(超详细)

Linux下安装MySQL8.0(超详细)

腾讯云开发者社区

cover

安卓手机如何连接苹果电脑

腾讯云开发者社区

所有评论(0)

查看更多评论

空白格2519

@weixin_56581189

已为社区贡献1条内容