我正在用Python实验NLTK包,我尝试用nltk.download()下载NLTK,我得到了这样的错误信息,如何解决这个问题?谢谢。我使用的系统是Ubuntu,安装在VMware下,IDE是Spyder。
nltk.download()
使用nltk.download('all')后,可以下载一些包,但下载oanc_masc时出现错误信息
nltk.download('all')
oanc_masc
g6ll5ycj1#
要下载特定的数据集/模型,请使用nltk.download()函数,例如,如果您希望下载punkt句子标记器,请用途:
punkt
$ python3 >>> import nltk >>> nltk.download('punkt')
如果您不确定需要哪种数据/模型,可以从基本的数据+模型列表开始:
>>> import nltk >>> nltk.download('popular')
它将下载一个“热门”资源列表。确保您拥有最新版本的NLTK,因为它一直在改进并不断维护:
NLTK
$ pip install --upgrade nltk
如果有人要避免从nltk下载较大数据集时出错,请从https://stackoverflow.com/a/38135306/610569
nltk
$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip $ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite $ python >>> import nltk >>> dler = nltk.downloader.Downloader() >>> dler._update_index() >>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed. >>> dler.download('popular')
如果有人想找到nltk_data目录,请参见https://stackoverflow.com/a/36383314/610569要配置nltk_data路径,请参见https://stackoverflow.com/a/22987374/610569
nltk_data
ebdffaop2#
从命令行导入nltk后,尝试
nltk.download('popular', halt_on_error=False)
在一个错误后,它会要求重试损坏的包,只需拒绝n,它将继续与正确的包。
wvyml7n53#
a)在OSX中运行第一个月B)切换到管理员用户(您已设置为具有管理员权限的用户)并在命令行中键入:/Applications/Python\ 3.6/Install\ Certificates.command
/Applications/Python\ 3.6/Install\ Certificates.command
注:
ls /Applications看看你在那里的python目录名。
ls /Applications
u7up0aaq4#
克服这个错误的一个简单(困难)的方法是手动完成这个过程。只需转到网站https://www.nltk.org/nltk_data/,下载所需的zip文件并提取内容。在Windows中,转到user/AppData/local/Programs/Python/Python(version)/lib并创建一个文件夹nltk_data。然后创建相应的文件夹。例如,对于'punkt'创建文件夹tokenizers并将解压文件夹中的文件夹'punkt'添加到其中。此信息主要由终端本身提供。运行你的程序。干杯!
https://www.nltk.org/nltk_data/
user/AppData/local/Programs/Python/Python(version)/lib
tokenizers
EDIT 1:当然,下载所有文件可能会很耗时,但如果“urlopen错误”持续存在,这是唯一的选择。EDIT 2您无法下载nltk文件,这也主要是您的路由器或网络的问题。尝试更改您的网络,这应该会有所帮助。
hi3rlvi25#
我有这个错误:
Resource punkt not found. Please use the NLTK Downloader to obtain the resource: import nltk nltk.download('punkt')
当我试图通过写作来解决:
import nltk nltk.download()
我的电脑突然唐斯,水蟒也关闭了。当我试图打开它总是显示错误。我解决这个问题的方法是:
import nltk nltk.download('punkt')
5条答案
按热度按时间g6ll5ycj1#
要下载特定的数据集/模型,请使用
nltk.download()
函数,例如,如果您希望下载punkt
句子标记器,请用途:如果您不确定需要哪种数据/模型,可以从基本的数据+模型列表开始:
它将下载一个“热门”资源列表。
确保您拥有最新版本的
NLTK
,因为它一直在改进并不断维护:已编辑
如果有人要避免从
nltk
下载较大数据集时出错,请从https://stackoverflow.com/a/38135306/610569如果有人想找到
nltk_data
目录,请参见https://stackoverflow.com/a/36383314/610569要配置
nltk_data
路径,请参见https://stackoverflow.com/a/22987374/610569ebdffaop2#
从命令行导入nltk后,尝试
在一个错误后,它会要求重试损坏的包,只需拒绝n,它将继续与正确的包。
wvyml7n53#
a)在OSX中运行
第一个月
B)切换到管理员用户(您已设置为具有管理员权限的用户)
并在命令行中键入:
/Applications/Python\ 3.6/Install\ Certificates.command
注:
ls /Applications
看看你在那里的python目录名。
u7up0aaq4#
克服这个错误的一个简单(困难)的方法是手动完成这个过程。只需转到网站
https://www.nltk.org/nltk_data/
,下载所需的zip文件并提取内容。在Windows中,转到
user/AppData/local/Programs/Python/Python(version)/lib
并创建一个文件夹nltk_data。然后创建相应的文件夹。例如,对于'punkt'创建文件夹tokenizers
并将解压文件夹中的文件夹'punkt'添加到其中。此信息主要由终端本身提供。运行你的程序。干杯!
EDIT 1:当然,下载所有文件可能会很耗时,但如果“urlopen错误”持续存在,这是唯一的选择。
EDIT 2您无法下载nltk文件,这也主要是您的路由器或网络的问题。尝试更改您的网络,这应该会有所帮助。
hi3rlvi25#
我有这个错误:
当我试图通过写作来解决:
我的电脑突然唐斯,水蟒也关闭了。当我试图打开它总是显示错误。
我解决这个问题的方法是: