如何从x列中选择唯一的列,但在sql中从结果中显示x+y列?

e5nszbig  于 2021-06-26  发布在  Impala
关注(0)|答案(2)|浏览(313)

这个表在我们的impala集群上,不过,impala shell似乎与sql非常相似。我很少sql或 Impala 的经验,除了做非常简单的查询,所以这个问题可能是远高于我的经验和薪酬等级。
我需要用 Impala 从数据库里得到一些数据。表中还有其他列,但我的命令获取了我感兴趣的这3列。数据/结果可以如下所示:

time | server | data
  0  |   A    | 500
  0  |   B    | 200
  0  |   C    | 300
  1  |   A    | 100
  1  |   A    | 400
  1  |   B    | 200
  1  |   C    | 300
  2  |   A    | 900
  2  |   B    | 800
  2  |   C    | 700
  2  |   C    | 600

理想情况下,数据应该看起来像时间0,每个服务器对于每个时间值只显示一次。但是,有一个bug,如图所示,一个服务器可以为一个时间值显示多次。也不是同一台服务器在每个时间值上显示一次以上,如上面的示例所示。
在任何情况下,我应该读取/查找什么impala shell/sql命令来告诉它选择不同的时间和服务器,但选择两个数据值中的较大值?我不知道如何继续过去:

select distinct time, server from table;

如果这太难或太复杂,也许有人可以告诉我一个命令,它选择不同的时间和服务器,但打印它为不同的时间和服务器对找到的第一个数据值。

ujv3wf0j

ujv3wf0j1#

mysql> begin;
Query OK, 0 rows affected (0.00 sec)

mysql> create table test_tabl(time int, server varchar(10), data int);
Query OK, 0 rows affected (0.03 sec)

mysql> insert into test_tabl values(0, 'A', 500), (0, 'B', 200), (0, 'C', 300);
Query OK, 3 rows affected (0.00 sec)
Records: 3  Duplicates: 0  Warnings: 0

mysql> insert into test_tabl values(1, 'A', 100), (1, 'A', 400), (1, 'B', 200), (1, 'C', 300);
Query OK, 4 rows affected (0.00 sec)
Records: 4  Duplicates: 0  Warnings: 0

mysql> insert into test_tabl values(2, 'A', 900), (2, 'B', 800), (2, 'C', 700), (2, 'C', 600);
Query OK, 4 rows affected (0.00 sec)
Records: 4  Duplicates: 0  Warnings: 0

mysql> select * from test_tabl;
+------+--------+------+
| time | server | data |
+------+--------+------+
|    0 | A      |  500 |
|    0 | B      |  200 |
|    0 | C      |  300 |
|    1 | A      |  100 |
|    1 | A      |  400 |
|    1 | B      |  200 |
|    1 | C      |  300 |
|    2 | A      |  900 |
|    2 | B      |  800 |
|    2 | C      |  700 |
|    2 | C      |  600 |
+------+--------+------+
11 rows in set (0.00 sec)

mysql>
mysql> select time, server, max(data) from test_tabl group by time, server;
+------+--------+-----------+
| time | server | max(data) |
+------+--------+-----------+
|    0 | A      |       500 |
|    0 | B      |       200 |
|    0 | C      |       300 |
|    1 | A      |       400 |
|    1 | B      |       200 |
|    1 | C      |       300 |
|    2 | A      |       900 |
|    2 | B      |       800 |
|    2 | C      |       700 |
+------+--------+-----------+
9 rows in set (0.00 sec)

mysql> rollback;
Query OK, 0 rows affected (0.00 sec)
jvlzgdj9

jvlzgdj92#

要获得唯一的时间和服务器值以及最大的数据值,可以使用带有 GROUP BY ,如下所示:

SELECT TIME, SERVER, MAX(DATA)
  FROM TABLE
  GROUP BY TIME, SERVER
  ORDER BY TIME, SERVER;

希望这有帮助。
分享和享受。

相关问题