我有一个推文列表。它们看起来像这样:
data = [['trading $aa $BB stock market info'],
['$aa is $116 market is doing well $cc $ABC']]
我想提取股票行情:
['$aa', '$BB']
['$aa', '$cc', '$ABC']]
我已经试过了:
for i in data:
print re.findall(r'[$]\S*', str(i))
并且,输出也包含$116:
['$aa', '$BB']
['$aa', '$116', '$cc', '$ABC']]
有什么建议吗?
3条答案
按热度按时间q0qdq0h21#
匹配美元符号、一个字母,然后是空格以外的任何字符:
ccrfmcuu2#
包
reticker
通过根据其配置创建一个自定义正则表达式来实现这一点。它使用创建的模式从文本中提取代码。或者,返回的模式可以单独使用。fcy6dtqo3#
我将把它放在这里,以便人们查找与股票代码匹配的正则表达式