获取具有特定值的记录数,但每个唯一字段只能获取一次

j2qf4p5b  于 2021-06-18  发布在  Mysql
关注(0)|答案(1)|浏览(383)

我不是在寻找一个完整的答案,但也许有一些关于我应该看什么样的mysql命令来解决这个问题的建议。
我有一系列传感器(30+)连接到我的网络。在不同的时间间隔,我请求它们的状态,每个设备用n个布尔值进行回复,其中n可以是0到120之间的任何值(因此响应可以是一个空对象、120个布尔值的列表或介于两者之间的任何值)。
根据接收到的布尔值,我创建一个新记录,以及设备的mac地址和时间戳。例如(另请参见此sqlfiddle):

+----+-------------------+---------------------+--------+    
| id | device_address    | timestamp           | status |
+----+-------------------+---------------------+--------+    
|  1 | f2:49:d2:17:5d:8d | 2018-09-22 15:54:51 |      0 |
|  2 | fd:30:ec:08:67:9a | 2018-09-22 15:54:56 |      0 |
|  3 | f8:8d:d9:64:a4:7c | 2018-09-22 15:54:58 |      1 |
|  4 | f2:49:d2:17:5d:8d | 2018-09-22 15:55:51 |      0 |
|  5 | f2:49:d2:17:5d:8d | 2018-09-22 15:55:52 |      0 |
|  6 | fd:30:ec:08:67:9a | 2018-09-22 15:55:56 |      1 |
|  7 | f8:8d:d9:64:a4:7c | 2018-09-22 15:55:58 |      1 |
|  8 | f2:49:d2:17:5d:8d | 2018-09-22 15:56:52 |      0 |
|  9 | f2:49:d2:17:5d:8d | 2018-09-22 15:57:52 |      1 |
| 10 | f2:49:d2:17:5d:8d | 2018-09-22 15:58:52 |      1 |
+----+-------------------+---------------------+--------+

或者,替换mac地址以提高可读性:

+----+-------------------+---------------------+--------+    
| id | device_address    | timestamp           | status |
+----+-------------------+---------------------+--------+    
|  1 | A                 | 2018-09-22 15:54:51 |      0 |
|  2 | BB                | 2018-09-22 15:54:56 |      0 |
|  3 | CCC               | 2018-09-22 15:54:58 |      1 |
|  4 | A                 | 2018-09-22 15:55:51 |      0 |
|  5 | A                 | 2018-09-22 15:55:52 |      0 |
|  6 | BB                | 2018-09-22 15:55:56 |      1 |
|  7 | CCC               | 2018-09-22 15:55:58 |      1 |
|  8 | A                 | 2018-09-22 15:56:52 |      0 |
|  9 | A                 | 2018-09-22 15:57:52 |      1 |
| 10 | A                 | 2018-09-22 15:58:52 |      1 |
+----+-------------------+---------------------+--------+

最后,我希望能够将这些值按时间间隔分组。例如,当我绘制过去2小时的数据时,我希望使用5分钟的间隔。每个间隔我想知道有多少(唯一的)设备在该期间至少有一次状态为1,还有多少设备只有零。根本不在时间块内出现的设备(因为它们没有返回布尔值)与该时间块无关
上述记录将在5分钟时间段中的两个时间段内:
15:50:00至15:54:59-ids 1 2 3
15:55:00至15:59:59-ids 4 5 6 7 8 9 10
我想要的回答是这样的:

+---------------------+---------------------------------+-------------------------+    
| timeblock start     | dev w/ at least one status of 1 | dev w/ only status of 0 |
+---------------------+---------------------------------+-------------------------+    
| 2018-09-22 15:50:00 |                               1 |                       2 |
| 2018-09-22 15:55:00 |                               2 |                       1 |
+---------------------+---------------------------------+-------------------------+

最终的结果不一定是这样的,其他可以帮助我推断这些数字的结果也会起作用。时间戳字段也是如此;这个 2018-09-22 15:50:00 格式将是伟大的,但其他格式也可以让我扣除时间块是什么。
这样做可以得到不同的时间块和每个时间块中唯一设备的数量,但是它计算1和0的总量,而不是合并每个唯一设备的结果。

SELECT timestamp, 
SUM(status) as ones, COUNT(status)-SUM(status) as zeroes, 
COUNT(DISTINCT(device_address)) as unique_devices 
FROM records 
GROUP BY UNIX_TIMESTAMP(timestamp) DIV 300 
ORDER BY timestamp ASC

结果:

+----------------------+------+--------+----------------+
| timestamp            | ones | zeroes | unique devices |
+----------------------+------+--------+----------------+
| 2018-09-22T15:54:51Z |    1 |      2 |              3 |
| 2018-09-22T15:57:52Z |    4 |      3 |              3 |
+----------------------+------+--------+----------------+
fbcarpbf

fbcarpbf1#

使用条件聚合

SELECT timestamp, 
       count(distinct case when status = 1 then device_address end) as ones, 
       count(distinct case when status = 0 then device_address end) as zeros, 
FROM records 
GROUP BY UNIX_TIMESTAMP(timestamp) DIV 300 
ORDER BY timestamp ASC

sqlfiddle演示

相关问题