阅读并按照错误信息,然后你会找出问题是什么。 在追溯中,您会看到一个指向for x in (len(tokenized_tweets)):行的箭头。错误消息如下:在for循环中你的可迭代对象是什么?(len(tokenized_tweets))这真的是一个可迭代对象吗?不,它是一个int。len()的输出总是一个int(除非你覆盖它)。 你应该把tokenized_tweetes的长度传递给range()对象,它是一个可迭代对象。
with open("wordslist.txt") as f:
words_list = {word.removesuffix("\n") for word in f}
with open("tweets.txt") as g:
for tweete in g:
for word in tweete.split():
if word not in words_list:
print(word)
2条答案
按热度按时间bfnvny8b1#
阅读并按照错误信息,然后你会找出问题是什么。
在追溯中,您会看到一个指向
for x in (len(tokenized_tweets)):
行的箭头。错误消息如下:在for
循环中你的可迭代对象是什么?(len(tokenized_tweets))
这真的是一个可迭代对象吗?不,它是一个int
。len()
的输出总是一个int
(除非你覆盖它)。你应该把
tokenized_tweetes
的长度传递给range()
对象,它是一个可迭代对象。额外头端:
既然你要为每条tweet找到单词,那么就把你的单词做成一个
set
。set的成员资格测试比list快得多。(O(1)〉O(n))如果有重复项,它也会删除。
溶液:
omqzjyyz2#
简单地使用它,您将错过编写
range
的机会