我已经安装了nltk软件包。接下来我尝试使用www.example.com()下载支持的软件包,但遇到错误:nltk.download() and am getting error:
[错误号11001]获取地址信息
我的计算机/软件详细信息是:
操作系统:Windows 8.1 Python:3.3.4 NLTK包:3.0
下面是在python中运行的命令:
Python 3.3.4 (v3.3.4:7ff62415e426, Feb 10 2014, 18:13:51) [MSC v.1600 64 bit (AMD64)] on win32
Type "copyright", "credits" or "license()" for more information.
import nltk
nltk.download()
showing info http://nltk.github.com/nltk_data/
True
nltk.download("all")
[nltk_data] Error loading all: <urlopen error [Errno 11001]
[nltk_data] getaddrinfo failed>
False
它看起来像是要到http://nltk.github.com/nltk_data/,而理想情况下它应该尝试从http://www.nltk.org/nltk_data/获取数据。
在另一台机器上,当我们在浏览器中键入http://nltk.github.com/nltk_data/时,它会重定向到http://www.nltk.org/nltk_data/。我不明白为什么重定向没有发生在我的笔记本电脑上。
我觉得这可能是问题所在。
好心帮忙。
我已经添加了命令提示符截图。需要帮助..
问候你邦森
8条答案
按热度按时间tez616oj1#
尝试下面的代码。它已按预期下载包
在链接被ssl修复之前看起来是断开的。
注:-已使用MAC
eblbsuwk2#
由于网络限制,我得到了这个错误。下面是我如何解决
浏览http://www.nltk.org/nltk_data/并从相应链接下载所需语料库。
然后将下载的文件放置在windows中的
C:/
文件夹路径中(或任何其他相关目录,如C:/ProgramData/Anaconda3
),文件夹结构与https://github.com/nltk/nltk_data/tree/gh-pages/packages中提到的相同btqmn9zl3#
我的问题是,当NLTK下载器启动时,它的服务器索引为-http://nltk.github.com/nltk_data/
需要将其更改为-http://nltk.org/nltk_data/
您可以通过进入NLTK Downloader窗口和File-〉Change Server Index来更改此设置。
问候你邦森
5us2dqdw4#
它通过“在环境变量中设置http & https代理”为我解决了问题
请向您的网络或管理团队询问此代理IP地址
hwamh0ep5#
该错误可能是系统所具有的代理的错误。请参阅以下链接以获取答案,答案已发布在此处:
下载NLTK数据出错:[错误号11004]获取地址信息失败
7bsow1i66#
我在Jupyter笔记本上也遇到过这个问题。下面的代码片段来自另一个stackoverflow的答案。以防万一它可能会帮助其他人-
参考:"getaddrinfo failed", what does that mean?
91zkwejq7#
我们也可以选择使用python提示符下载包,或者从笔记本电脑中使用以下配置下载包。根据您的代理设置,可以是http或https。
gcxthw6b8#
Jio网络(SIM卡和光纤)有问题,请尝试从其他互联网服务提供商下载,即Airtel,BSNL或其他。