我有以下推特数据。
数据分为两部分:
@Username
以及tweet或文本:
RT @username: Stay behind, or take the jump (anything in text or tags and emoji)#@name
@姓名jjjjj dhdkeueh sjdyeh@kdudiwi。。。。。
RT @username: thehdydvekdgeke
Hshedhdkdjfnfjfkfmhdkalshsh公司+£) #&#(#(£63+kdjdj??☺?☺? rt@username:这首歌叫kdudhekh juygg jyttt hyyg
£jdhdieo+3-)£) 7——uuueoehrmwowyeheldyejelwyej
Djyegeleisyhekelsudhewksi公司
这是数据,我想把数据分成两部分,第一部分是用户名,第二部分是tweet。
我做的正则表达式是:
^(RT\s[^ ]*)\s([\W]*[\H]*[\w\s@#;:!?+(+-_#)]*)$
第一部分有效,但第二部分无效。
有人能帮我吗?
1条答案
按热度按时间hfyxw5xn1#
结果:
使用
'^RT\\s(\\S*):\\s(.*)$'
如果您不想在用户名中使用“:”。或者
'^RT\\s(\\S*):?\\s(.*)$'
如果:
是可选的:结果: