此问题已在此处有答案:
Regular expression to match an exact number of occurrence for a certain character(4个答案)
18天前关闭
什么是正则表达式,它可以在文本语料库中找到多少个单词有相同的辅音出现超过四次?例如,德语单词Sonnentrunkenheiten有6个n。
这个正则表达式([b-df-hj-np-tv-z])\1{3,}
只显示了四个连续的辅音。
此问题已在此处有答案:
Regular expression to match an exact number of occurrence for a certain character(4个答案)
18天前关闭
什么是正则表达式,它可以在文本语料库中找到多少个单词有相同的辅音出现超过四次?例如,德语单词Sonnentrunkenheiten有6个n。
这个正则表达式([b-df-hj-np-tv-z])\1{3,}
只显示了四个连续的辅音。
4条答案
按热度按时间ef1yzkbh1#
如果你正在使用Python,你真的不需要正则表达式。但在这里
一个更好的解决方案是使用
Counter
,并打印所有出现三次以上的辅音(因此“kankeudenkaankohan”中的“n”和“k”)sbtkgmzw2#
你只需要添加一个词来匹配单词的其他部分,在一个
\1
的组中。为了方便起见,我在这里使用.*
。我将使它成为一个非捕获组,因为没有必要捕获最后一个事件。Try it online on regex101
示例匹配:
也匹配(由于
.*
而不是更精确的东西):rfbsl7qr3#
为了匹配一个词,你可以用下面的。
尽管如此,我还是建议使用 for-loop 来解析值。
下面是一个单词的例子。
输出
这里有一个句子的例子。
输出
从这里开始,只需编写一个 * 方法 * 来返回计数。
fumotvh34#
求反re.findall中的辅音,并计算结果列表的长度