Ruby eager查询导致加载问题

5jvtdoz2 于 2022-12-03 发布在 Ruby

关注(0)|答案(1)|浏览(95)

为了解释我所面临的问题，让我举一个来自RubySequel文档的例子。
在

Album.eager(:artists, :genre).all

如果数据相对较少，这将是好的。
如果数据量很大，这个查询将触发数以千计的artist_id。如果数据量以百万计，则将收集一百万个artist_id。是否有办法获取相同的输出，但使用不同的优化查询？

ruby

来源：https://stackoverflow.com/questions/74637608/ruby-eager-query-causing-load-issues

1条答案

按热度按时间

h5qlskok1#

只是不要急于加载大数据集，也许？：）
(TL;DR：这不是一个答案，而是一个罗嗦的方式说“没有一个简单的答案”：））
简单问题的简单解决方案。默认的（幼稚的）急切加载策略有效地解决了相当小的关系的N+1问题，但如果你试图急切加载巨大的关系，你可能会（也会）自杀。
例如，如果您只获取1000个带有id的相册，（1到1000）、那么您的ORM将触发额外的急切加载查询，以查找in列表中可能包含1000个id的select * from <whatever> where album_id in (1,2,3,...,1000)这样的艺术家和流派。where ... in查询的性能可能不是最佳的，即使是在现代数据库中，其查询计划器像爱因斯坦一样聪明。在一定的数据规模下，即使是如此小的一批数据，这也会变得非常慢。如果您尝试立即加载 * Just everything*（如您的示例中所示）-几乎不适用于任何实际数据使用（除了最小的用例）。
所以，
1.一般情况下，最好避免加载“全部”，而是批量加载数据;

EXPLAIN是您最好的朋友-始终分析您的ORM触发的查询。即使是经过实战测试的生产级ORM也可能（并且将）不时产生次优查询;
1.后者对于大型数据集尤其如此--在一定的规模下，您将别无选择，只能从优秀的ORM API迁移到较低级别的定制SQL查询（至少对于瓶颈）;
1.在一定的规模，甚至自定义SQL将不再有帮助-该规模的问题需要在另一个层面上解决（数据重塑，缓存，分片，CQRS等等...）

赞(0）回复(0）举报 2022-12-03

我来回答

Ruby eager查询导致加载问题

1条答案

相关问题

热门标签

最新问答