mysql复合索引列顺序和性能

wnvonmuf 于 2021-06-20 发布在 Mysql

关注(0)|答案(2)|浏览(534)

我有一个大约500000行的表，我正在测试它的两个复合索引。第一个索引按列的顺序放在最后，第二个索引则按相反的顺序。
我不明白的是，为什么第二个索引提供了更好的性能，与第一个查询的889行相比，第二个索引估计要扫描30行，因为我觉得第二个索引不能正确使用，因为order by列不是最后一个。有人能解释为什么会这样吗？如果两者都存在，mysql更喜欢第一个索引。
请注意，第二个解释将可能的\u键列为null，但仍然列出所选的键。
1）第一个索引

ALTER TABLE user ADD INDEX test1_idx (city_id, quality);

（基数12942）

EXPLAIN SELECT * FROM user u WHERE u.city_id = 3205 ORDER BY u.quality DESC LIMIT 30;
+----+-------------+-------+--------+---------------+-----------+---------+----------------+------+-------------+
| id | select_type | table | type   | possible_keys | key       | key_len | ref            | rows | Extra       |
+----+-------------+-------+--------+---------------+-----------+---------+----------------+------+-------------+
|  1 | SIMPLE      | u     | ref    | test1_idx     | test1_idx | 3       | const          |  889 | Using where | 
+----+-------------+-------+--------+---------------+-----------+---------+----------------+------+-------------+

2）第二个索引（相同字段的顺序相反）

ALTER TABLE user ADD INDEX test2_idx (quality, city_id);

（基数7549）

EXPLAIN SELECT * FROM user u WHERE u.city_id = 3205 ORDER BY u.quality DESC LIMIT 30;
+----+-------------+-------+--------+---------------+-----------+---------+----------------+------+-------------+
| id | select_type | table | type   | possible_keys | key       | key_len | ref            | rows | Extra       |
+----+-------------+-------+--------+---------------+-----------+---------+----------------+------+-------------+
|  1 | SIMPLE      | u     | index  | NULL          | test2_idx | 5       | NULL           |  30  | Using where | 
+----+-------------+-------+--------+---------------+-----------+---------+----------------+------+-------------+

更新：
第二个查询在实际场景中执行得不好，而第一个查询则如预期的那样执行得很好。我仍然很好奇为什么mysql explain会提供如此相反的信息。

mysql indexing

来源：https://stackoverflow.com/questions/51655846/mysql-composite-index-column-order-performance

2条答案

按热度按时间

pgky5nke1#

explain中的行只是mysql认为必须检查以产生结果的行数的估计。
我记得读过一篇来自percona的PeterZaitsev的文章说这个数字可能非常不准确。因此，不能简单地根据这个数字来比较查询效率。
我同意你的看法，第一个索引在正常情况下会产生更好的结果。
您应该注意到，第一个explain中的type列是ref，而第二个explain中的index是ref。ref通常比索引扫描好。正如您所提到的，如果两个键都存在，mysql会选择第一个键。

赞(0）回复(0）举报 2021-06-20

yzuktlbb2#

我猜您的数据类型city\u id:mediumint 3字节质量：smallint 2字节
据我所知，为了

SELECT * FROM user u WHERE u.city_id = 3205 ORDER BY u.quality DESC LIMIT 30;

第二个指标（质量、城市标识）不能得到充分利用。因为order by是范围扫描，只能对索引的最后一部分进行扫描。
第一个索引看起来非常适合。我猜有时候mysql不是那么聪明。可能目标城市id的数量会影响mysql决定使用哪个索引。
你可以试试关键词

FORCE INDEX(test1_idx)

赞(0）回复(0）举报 2021-06-20

我来回答

mysql复合索引列顺序和性能

2条答案

相关问题

热门标签

最新问答