如何使用LIMIT子句中的大偏移量来加速MySQL查询？

dluptydi 于 2023-01-29 发布在 Mysql

关注(0)|答案(6)|浏览(121)

当LIMIT使用大偏移量的mysql SELECT时，我遇到了性能问题：

SELECT * FROM table LIMIT m, n;

如果偏移量m例如大于1，000，000，则操作非常慢。
我确实必须使用limit m, n;我不能使用类似id > 1,000,000 limit n的东西。
如何优化此语句以获得更好的性能？

mysql

来源：https://stackoverflow.com/questions/1243952/how-can-i-speed-up-a-mysql-query-with-a-large-offset-in-the-limit-clause

6条答案

按热度按时间

4sup72z81#

也许您可以创建一个索引表，提供与目标表中的键相关的顺序键。然后您可以将此索引表联接到目标表，并使用where子句更有效地获取所需的行。

#create table to store sequences
CREATE TABLE seq (
   seq_no int not null auto_increment,
   id int not null,
   primary key(seq_no),
   unique(id)
);

#create the sequence
TRUNCATE seq;
INSERT INTO seq (id) SELECT id FROM mytable ORDER BY id;

#now get 1000 rows from offset 1000000
SELECT mytable.* 
FROM mytable 
INNER JOIN seq USING(id)
WHERE seq.seq_no BETWEEN 1000000 AND 1000999;

赞(0）回复(0）举报 2023-01-29

ycl3bljg2#

如果记录很大，则加载数据可能会很慢。如果ID列已建立索引，则只需选择它就会快得多。然后，可以使用IN子句执行第二次查询，以获得相应的ID（或者可以使用第一次查询中的最小和最大ID来制定WHERE子句）。
慢：

SELECT * FROM table ORDER BY id DESC LIMIT 10 OFFSET 50000

快速：

SELECT id FROM table ORDER BY id DESC LIMIT 10 OFFSET 50000

SELECT * FROM table WHERE id IN (1,2,3...10)

赞(0）回复(0）举报 2023-01-29

cnwbcb6i3#

互联网上有一篇博客文章，介绍了如何最好地使要显示的行的 * 选择 * 尽可能紧凑，因此：只有身份证并且生成完整的结果应该反过来获取您想要的所有数据，仅用于您选择的行 *。
因此，SQL可能是这样的（未经测试，我不确定它是否真的有用）：

select A.* from table A 
  inner join (select id from table order by whatever limit m, n) B
  on A.id = B.id
order by A.whatever

如果您的SQL引擎太原始而不允许使用这种SQL语句，或者它没有改进任何东西，那么可能值得将这个语句分解为多个语句，并将id捕获到数据结构中。

更新：我找到了我谈论的博客文章：是杰夫·阿特伍德在《编程恐怖》里的"All Abstractions Are Failed Abstractions"

赞(0）回复(0）举报 2023-01-29

nlejzf6q4#

我认为如果你的表已经有了一个单独的索引，就没有必要再创建一个单独的索引了。如果是这样，你可以通过这个主键来排序，然后使用这个键的值来逐步执行：

SELECT * FROM myBigTable WHERE id > :OFFSET ORDER BY id ASC;

另一种优化方法是不使用SELECT * 而只使用ID，这样它就可以简单地读取索引，而不必定位所有数据（减少IO开销）。如果您需要其他一些列，那么也许可以将它们添加到索引中，以便使用主键读取它们（这将最有可能被保存在内存中，因此不需要光盘查找）-虽然这将不适合所有情况，所以你将不得不有一个发挥。

赞(0）回复(0）举报 2023-01-29

xpcnnkqh5#

Paul狄克逊的答案确实是这个问题的解决方案，但是您必须维护序列表并确保没有行间隙。
如果这是可行的，更好的解决方案是确保原始表没有行间隙，并从id 1开始，然后使用id获取行进行分页。
SELECT * FROM表格A，其中id〉= 1且id〈= 1000;
SELECT * FROM表格A，其中id〉= 1001且id〈= 2000;
等等...

赞(0）回复(0）举报 2023-01-29

q35jwt9p6#

我最近遇到了这个问题。这个问题有两个部分需要解决。首先，我必须在FROM子句中使用一个内部select，它只对主键进行限制和偏移：

$subQuery = DB::raw("( SELECT id FROM titles WHERE id BETWEEN {$startId} AND {$endId}  ORDER BY title ) as t");

然后，我可以使用它作为查询的from部分：

'titles.id',
                            'title_eisbns_concat.eisbns_concat', 
                            'titles.pub_symbol', 
                            'titles.title', 
                            'titles.subtitle', 
                            'titles.contributor1', 
                            'titles.publisher', 
                            'titles.epub_date', 
                            'titles.ebook_price', 
                            'publisher_licenses.id as pub_license_id', 
                            'license_types.shortname',
                            $coversQuery
                        )
                        ->from($subQuery)
                        ->leftJoin('titles',  't.id',  '=', 'titles.id')
                        ->leftJoin('organizations', 'organizations.symbol', '=', 'titles.pub_symbol') 
                        ->leftJoin('title_eisbns_concat', 'titles.id', '=', 'title_eisbns_concat.title_id') 
                        ->leftJoin('publisher_licenses', 'publisher_licenses.org_id', '=', 'organizations.id') 
                        ->leftJoin('license_types', 'license_types.id', '=', 'publisher_licenses.license_type_id')

第一次创建这个查询时，我使用了MySql中的OFFSET和LIMIT。这个功能一直很好，直到我到达第100页后，偏移量开始变得慢得无法忍受。在我的内部查询中将其更改为BETWEEN，可以加快任何页面的偏移量。我不知道为什么MySql没有加快OFFSET，但BETWEEN似乎又把它卷回来了。

赞(0）回复(0）举报 2023-01-29

我来回答

如何使用LIMIT子句中的大偏移量来加速MySQL查询？

6条答案

相关问题

热门标签

最新问答