ubuntu 使用www.example.com()下载时出错nltk.download

jv2fixgn  于 2022-12-22  发布在  其他
关注(0)|答案(5)|浏览(201)

我正在用Python实验NLTK包,我尝试用nltk.download()下载NLTK,我得到了这样的错误信息,如何解决这个问题?谢谢。
我使用的系统是Ubuntu,安装在VMware下,IDE是Spyder。

使用nltk.download('all')后,可以下载一些包,但下载oanc_masc时出现错误信息

g6ll5ycj

g6ll5ycj1#

要下载特定的数据集/模型,请使用nltk.download()函数,例如,如果您希望下载punkt句子标记器,请用途:

$ python3
>>> import nltk
>>> nltk.download('punkt')

如果您不确定需要哪种数据/模型,可以从基本的数据+模型列表开始:

>>> import nltk
>>> nltk.download('popular')

它将下载一个“热门”资源列表。
确保您拥有最新版本的NLTK,因为它一直在改进并不断维护:

$ pip install --upgrade nltk

已编辑

如果有人要避免从nltk下载较大数据集时出错,请从https://stackoverflow.com/a/38135306/610569

$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python

>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')

如果有人想找到nltk_data目录,请参见https://stackoverflow.com/a/36383314/610569
要配置nltk_data路径,请参见https://stackoverflow.com/a/22987374/610569

ebdffaop

ebdffaop2#

从命令行导入nltk后,尝试

nltk.download('popular', halt_on_error=False)

在一个错误后,它会要求重试损坏的包,只需拒绝n,它将继续与正确的包。

wvyml7n5

wvyml7n53#

a)在OSX中运行
第一个月
B)切换到管理员用户(您已设置为具有管理员权限的用户)
并在命令行中键入:
/Applications/Python\ 3.6/Install\ Certificates.command

注:

  • “\”是必需的,因为它们转义文件名中的空白字符。
  • 如果您安装了python 3.6,则此过程有效,否则请更改它以匹配您安装的python版本...对于此执行:

ls /Applications
看看你在那里的python目录名。

u7up0aaq

u7up0aaq4#

克服这个错误的一个简单(困难)的方法是手动完成这个过程。只需转到网站https://www.nltk.org/nltk_data/,下载所需的zip文件并提取内容。
在Windows中,转到user/AppData/local/Programs/Python/Python(version)/lib并创建一个文件夹nltk_data。然后创建相应的文件夹。例如,对于'punkt'创建文件夹tokenizers并将解压文件夹中的文件夹'punkt'添加到其中。此信息主要由终端本身提供。
运行你的程序。干杯!

EDIT 1:当然,下载所有文件可能会很耗时,但如果“urlopen错误”持续存在,这是唯一的选择。
EDIT 2您无法下载nltk文件,这也主要是您的路由器或网络的问题。尝试更改您的网络,这应该会有所帮助。

hi3rlvi2

hi3rlvi25#

我有这个错误:

Resource punkt not found. Please use the NLTK Downloader to obtain the resource: import nltk nltk.download('punkt')

当我试图通过写作来解决:

import nltk

nltk.download()

我的电脑突然唐斯,水蟒也关闭了。当我试图打开它总是显示错误。
我解决这个问题的方法是:

import nltk

nltk.download('punkt')

相关问题