将regex匹配项添加到一起

v9tzhpje  于 2021-06-30  发布在  Java
关注(0)|答案(2)|浏览(201)

我想创建一个正则表达式来匹配以下字符串中的所有元素:

11 jan. 22:20 - Dam: Ik zal d'r zijn

我要匹配日期、时间、姓名(dam)和消息。
目前,我有以下正则表达式:

checks date: [1-31 a-z]
checks message: ([^:]+)(.*)$
checks time: (([0-1]?[0-9]|2[0-3]):[0-5][0-9])
checks name: (?:\s[^:-]+)

我怎么把这些粘在一起?我想这样使用它:

String date = matcher.group(1);
Time time = new Time(matcher.group(2));
String name = matcher.group(3);
Message message = new Message(matcher.group(4));
Chat chat = new Chat(date,time,name,message);

此外,名称不仅与-\s之后的值匹配,还与消息和部分时间匹配。

tuwxkamq

tuwxkamq1#

import java.util.regex.Pattern;
import java.util.regex.Matcher;

public class HelloWorld {
  public static void main(String[] args) {
    Pattern p = Pattern.compile("(\\d{1,2}\\s[a-z]{3})\\.?\\s(\\d{1,2}:\\d{1,2})\\s-\\s([a-z]+):\\s(.+)", Pattern.CASE_INSENSITIVE);
    Matcher m = p.matcher("11 jan. 22:20 - Dam: Ik zal d'r zijn");

    while (m.find())
    {
      for (int i=1; i <= m.groupCount(); ++i)
        System.out.println("group " + i + ": " + m.group(i));
    }
  }
}

输出:
第一组:1月11日
第二组:22:20
第3组:大坝
第4组:ik zal d'r zijn
api注解:
默认情况下,不区分大小写的匹配假设仅匹配us ascii字符集中的字符。通过将unicode\u case标志与此标志一起指定,可以启用支持unicode的不区分大小写匹配。
您可能希望捕获月份名称后的句点,在这种情况下,您可以移动右括号。您可能还希望在名称中包含非字母字符,如果是,请更新 ([a-z]+) 角色类。
链接:regex101,regexplanet java(当你跟随链接时,你必须手动检查不区分大小写的标志,不知道为什么他们不保留那些在share链接中)。

lsmepo6l

lsmepo6l2#

这是正则表达式字符串

([\\w\\s]+)([\\s\\.]*)([\\d:]+)([\\s\\-]*)([\\w]+)([\\s:]*)([\\s\\S]*)

更新regex

([\w\s]+)(?:[\s\.]*)([\d:]+)(?:[\s\-]*)([\w]+)(?:[\s:]*)([\s\S]*)

查看此链接https://regex101.com/r/cp8cu9/2
测试:

Pattern pattern = Pattern
        .compile("([\\w\\s]+)(?:[\\s\\.]*)([\\d:]+)(?:[\\s\\-]*)([\\w]+)(?:[\\s:]*)([\\s\\S]*)");
Matcher matcher = pattern
        .matcher("11 jan. 22:20 - Dam: Ik zal d'r zijn");
while (matcher.find()) {
    System.out.println(String.format("Date: %s", matcher.group(1)));
    System.out.println(String.format("Time: %s", matcher.group(2)));
    System.out.println(String.format("Name: %s", matcher.group(3)));
    System.out.println(String.format("Message: %s", matcher.group(4)));
}

或者你可以做一个循环来获取数据

while (matcher.find()) {
    int groupCnt = matcher.groupCount();
    for (int i = 1; i <= groupCnt; i++) {
        System.out.println(matcher.group(i));
    }
}

查看此链接:https://regex101.com/r/cp8cu9/1 了解如何获取指定组(查看右侧边栏)
结果:

Date: 11 jan
Message: Ik zal d'r zijn
Time: 22:20
Name: Dam

相关问题