我有一张单子
top = ['GME', 'MVIS', 'TSLA', 'AMC']
我有一个数据集
dt ... text
0 2021-03-19 20:59:49+06 ... I only need TSLA TSLA TSLA TSLA to hit 20 eod to make up for a...
1 2021-03-19 20:59:51+06 ... Oh this isn’t good
2 2021-03-19 20:59:51+06 ... lads why is my account covered in more GME ...
3 2021-03-19 20:59:51+06 ... I'm tempted to drop my last 800 into some TSLA...
所以我要做的是检查这个句子是否包含了超过3个单词,从列表中我想删除这一行
谢谢你的帮助
1条答案
按热度按时间ktca8awb1#
让我们编写一个函数,确定在给定的句子中,是否有“top”列表中的3个以上的单词:
然后,无论句子是否包含列表中的3个以上单词,都要创建一列true/false。让我们使用Pandas Dataframe 结构:
然后我们只保留列表中没有包含3+个单词的句子的行:
此外,您可以删除我们创建的列: