我正在做一个C#项目,只接受用户的阿姆哈拉语,我想使用正则表达式来计算输入。
这是我发现的适用于拉丁语单词的函数。我希望这个相同的函数只通过改变正则表达式就能对阿姆哈拉语单词起作用。
private static bool IsAmharicText(string text)
{
string pattern = @"\p{IsLatin}";
MatchCollection matches = Regex.Matches(text, pattern, RegexOptions.Multiline);
return matches.Count > 0;
}
我已经研究并发现阿姆哈拉语字符属于埃塞俄比亚文字范围(Unicode范围:1200-137F)。我想使用正则表达式来匹配这些字符。
我想创建一个正则表达式模式来评估给定文本是否包含阿姆哈拉语字符。
我很感激你能给予我一个代码片段。
1条答案
按热度按时间gwo2fgha1#
一旦你知道了字符范围,事情就变得非常简单了:
[\u1200-\u137F]
或者,您可以使用Unicode属性表示法:
\p{IsEthiopic}
有关Unicode类别/脚本/块的更多信息可以在优秀的regular-expressions.info中找到。