【问题描述】

from pyspark import SparkConf, SparkContext
conf = SparkConf().setMaster('local').setAppName('My App')
sc = SparkContext(conf=conf)
rdd = sc.parallelize([1, 2, 3, 4, 5])
print(rdd.reduce(lambda a, b: a + b))

出现错误

【报错原因】

没有配置Python的环境变量,我们需要把环境变量写进去

【解决方法】

在原代码中加入以下代码

import os

os.environ['PYSPARK_PYTHON'] = r'C:\Users\WANG-PC\AppData\Local\Programs\Python\Python39\python.exe' #写你自己的路径

conf = SparkConf().setMaster('local').setAppName('My App')
sc = SparkContext(conf=conf)
rdd = sc.parallelize([1, 2, 3, 4, 5])
print(rdd.reduce(lambda a, b: a + b))

注:文件路径要替换成你自己Python解释器的路径。

 如何看自己使用的Python解释器路径?

 【成功解决】

 

 

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐