csv 根据日期值计算linux目录中出现的次数

gdrx4gfi  于 2023-05-20  发布在  Linux
关注(0)|答案(1)|浏览(110)

所以我有相当多的文件,我想检查文件计数的基础上的日期,但事情是日期重叠的文件有时。例如,一个文件可能看起来像这样
| 发行日期|证书ID|串行|
| --------------|--------------|--------------|
| 2023-05-14 06:00:00|一百二十三|abca234|
| 2023-05-14 23:59:00|四五六|盖斯马尔|
| 2019 -05-15 00:00:00|七八九|阿克马尔|
| 2023-05-16 12:10:00|一二三一|阿克姆克拉|
在目录中,我有一堆文件,它们的名称中可能有两个或更多的日期,因此无法知道每个日期有多少证书。例如2023-05-15-2023-05-18.csv.gmz、2023- 05-18-2023-05-19-2023.csv.gmz等。有没有一个快速简单的方法来计算这些文件的基础上的问题日期以上,显然issue_date是不是唯一的,但序列号/cert_id是。所以我可以把它结合起来我试图做的是基于给定日期以编程方式检查计数,但我不确定查询这些文件是否太有效,也许最好在这些文件的来源上使用API。但我还是想问问。
因此,如果我输入2023-05-14作为给定的日期,我会得到两个条目,对于15日,我会得到1个条目,16日也是1个条目。
重要更新:我忘记了有时一个文件末尾的证书会延续到下一个文件的开头,所以我必须考虑重复的内容。现在我有这个zgrep -c -F '2023-05-11' *2023-05-11*.gz | awk -F: '{n+=$2} END {print n}',但没有说明这个事实。

cetgtptt

cetgtptt1#

将所有未压缩的文件连接起来,然后通过管道将其传输到grep

zcat *2023-05-11*.gz | grep -c -F 2023-05-11

相关问题