linux 使用gawk命令的REGEX

46scxncf 于 2022-12-03 发布在 Linux

关注(0)|答案(4)|浏览(117)

在Linux中，我运行以下命令

pmap -x $PID | tail -n 1

这会给我一个类似下面的行：

total kB         168194812  870692  852296

我正在尝试提取第二个数字（rss）以供使用。我在www.example.com中找到了此示例regex101.com:

/[^\d]*[\d]+[\s]+([\d]+)/

然而，当我尝试对我的文本行运行它时，我没有得到任何打印输出：

echo "total kB         168194812  870692  852296" | gawk 'match($0, /[^\d]*[\d]+[\s]+([\d]+)/, a) {print a[1]}'

我希望它能印出来

4条答案

就像这样：

$ pmap -x $PID | gawk 'match($0, /[^0-9]*[0-9]+\s+([0-9]+)/, a) {print a[1]}'
870692

表达式\d是特定的Perl/PCRE兼容正则表达式。一些语言如Python也使用这个表达式。
您可以简化为：

awk '{print $4}'

使用grep：

grep -oP '\d+(?=\s+\d+$)'

如果只显示第4个字段，

awk '{print $4}'

以你为例

echo "total kB         168194812  870692  852296" | awk '{print $4}'

使用GNU grep和你展示的示例，请尝试以下grep代码。以下是完整的Online regex demo正则表达式。

echo "total kB         168194812  870692  852296" |
grep -oP '^total kB\s+\d+\s+\K\d+'

说明：

如果要使用awk，可以将数字与[0-9]和求反版本[^0-9]匹配
当您使用tail -n 1输出单行时，您也可以使用gnu awk将行分隔符设置为1位或更多位数，并在行号为2时打印行终止符。

echo "total kB         168194812  870692  852296" | 
awk -v RS='[0-9]+' 'NR == 2 {print RT}'

输出量