Regex查找以特定字符开头的单词

4xy9mtcn 于 2023-04-13 发布在其他

关注(0)|答案(6)|浏览(238)

我试图找到以特定字符开头的单词，例如：
Lorem ipsum #text Second lorem ipsum.你好吗？没事了。完成了。现在还有别的事情。
我需要得到所有以“#”开头的单词。所以我的预期结果是#text，#are，#else
有什么想法吗

regex

来源：https://stackoverflow.com/questions/2678666/regex-to-find-words-that-start-with-a-specific-character

6条答案

按热度按时间

7bsow1i61#

搜索：

不是单词字符的东西
一些单词字符

试试这个：

/(?<!\w)#\w+/

在C#中，它看起来像这样：

string s = "Lorem ipsum #text Second lorem ipsum. How #are You. It's ok. Done. Something #else now.";
foreach (Match match in Regex.Matches(s, @"(?<!\w)#\w+"))
{
    Console.WriteLine(match.Value);
}

输出：

#text
#are
#else

赞(0）回复(0）举报 2023-04-13

cpjpxq1n2#

试试这个#(\S+)\s?

赞(0）回复(0）举报 2023-04-13

nhn9ugyo3#

白色后或行首以#开头的单词。根据您的用法，不需要最后一个单词的边界。

/(?:^|\s)\#(\w+)\b/

括号将把你的单词放在一个组中。现在，它取决于你如何应用这个正则表达式的语言。
(?:...)是非捕获组。

赞(0）回复(0）举报 2023-04-13

rslzwgfq4#

下面的代码应该可以解决这个问题。

/\$(\w)+/g搜索以$开头的单词
/#(\w)+/g搜索以#开头的单词

Mark Bayers给出的答案/(?<!\w)#\w+/在RegExr.com网站上给出了如下警告

"(?<!" The "negative lookbehind" feature may not be supported in all browsers.

可以通过删除>将其更改为(?!\w)@\w+来修复此警告

赞(0）回复(0）举报 2023-04-13

mzmfm0qo5#

为了适应不同的语言，我有这个（PCRE/PHP）：

'~(?<!\p{Latin})#(\p{Latin}+)~u'

或

$language = 'ex. get form value';
'~(?<!\p{' . $language . '})#(\p{' . $language . '}+)~u'

或循环执行多个脚本

$languages = $languageArray;

$replacePattern = [];

foreach ($languages as $language) {

  $replacePattern[] = '~(?<!\p{' . $language . '})#(\p{' . $language . '}+)~u';

}

$replacement = '<html>$1</html>';

$replaceText = preg_replace($replacePattern, $replacement, $text);

\w工作得很好，但据我所知，它只适用于拉丁字母。
在上述示例中，将Latin切换为Cyrillic或Phoenician。
上面的示例不适用于“RTL”脚本。

赞(0）回复(0）举报 2023-04-13

qf9go6mv6#

试试这个：\B\#\w+
单词边界，后跟字符，再后跟一个或多个单词字符。

赞(0）回复(0）举报 2023-04-13