一、无法使用nltk.download()下载

当在执行下面的语句的时候,遇到了获取地址失败的错误。

import nltk
nltk.download()

像是这样:

## 二、问题分析

产生这个问题的原因是在不会科学上网的话,我们无法访问https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml这个地址。
然后自己在网上找了很多的教程来解决这个问题,都没能得到很好的解决,大多都是通过修改hosts文件来访问这个地址达到下载数据的目的,所以我们最终的目的是下载数据,而不是访问这个地址
如果我们事先就下好这个文件然后将这个文件放在合适的位置不就行了嘛

可以在下面的报错中看到,程序有去下面这些地址寻找nltk_data文件夹,而这个文件夹就是我们需要去访问地址下载的数据,我们只要将nltk_data这个数据文件夹放在下列任一路径中即可

-'C:\\Users\\plume/nltk_data'
-'D:\\anaconda\\nltk_data'
-'D:\\anaconda\\share\\nltk_data'
-'D:\\anaconda\\lib\\nltk_data'
-'C:\\Users\\plume\\AppData\\Roaming\\nltk_data'
-'C:\\nltk_data'
-'D:\\nltk_data'
-'E:\\nltk_data'

nltk_data的百度网盘地址:https://pan.baidu.com/s/1Pc_-tdFPGeYB4TRWqno55g
提取密码:ilge

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐