我尝试使用contractions.fix
来扩展数据集中的单词。但是当我运行代码并尝试将扩展的单词添加到数据集中的新列时,我得到一个错误String index out of range。我试着到处寻找,但我找不到解决办法。
数据集的屏幕截图,我想在comments
列上运行contractions.fix
代码的屏幕截图和抛出的错误:
这是我运行收缩的代码。
rws["expanded_words"]=rws['comments'].apply(lambda x: [contractions.fix(word) for word in x.split()])
1条答案
按热度按时间3pvhb19x1#
nltk.download('wordnet')
nltk.download('punkt')
nltk.download('onw-1.4')
nltk.download('averaged_percepton_tagger')
它需要这些下载工作,我的工作,只要我有这些