.net EntityFramework中的.Include()与Load()性能比较

s6fujrry 于 2022-12-20 发布在 .NET

关注(0)|答案(7)|浏览(240)

当查询一个大的表时，你需要在代码中访问导航属性（我明确地不想使用延迟加载），.Include()和.Load()哪一个执行得更好？或者为什么使用一个而不是另一个？
在这个例子中，被包含的表都只有大约10个条目，而employees有大约200个条目，而且可能发生的情况是，这些条目中的大多数都将被include加载，因为它们匹配where子句。

Context.Measurements.Include(m => m.Product)
                    .Include(m => m.ProductVersion)
                    .Include(m => m.Line)
                    .Include(m => m.MeasureEmployee)
                    .Include(m => m.MeasurementType)
                    .Where(m => m.MeasurementTime >= DateTime.Now.AddDays(-1))
                    .ToList();

或

Context.Products.Load();
Context.ProductVersions.Load();
Context.Lines.Load();
Context.Employees.Load();
Context.MeasurementType.Load();

Context.Measurements.Where(m => m.MeasurementTime >= DateTime.Now.AddDays(-1))
                    .ToList();

.net

来源：https://stackoverflow.com/questions/19319116/include-vs-load-performance-in-entityframework

7条答案

按热度按时间

vuktfyat1#

更新答案：从EF Core 5.0开始，您可以使用AsSplitQuery()。
这是特别有用的，我个人使用它所有的时间，当我有许多连接，这将导致可能的笛卡尔爆炸，或将只是需要更多的时间来完成。
顾名思义，EF将为每个实体执行单独的查询，而不是使用连接。
因此，在您使用显式加载的地方，您现在可以使用带拆分查询的Eager加载来实现相同的结果，而且它无疑更具可读性。
参见https://learn.microsoft.com/en-us/ef/core/querying/single-split-queries

赞(0）回复(0）举报 2022-12-20

h5qlskok2#

看情况，两个都试试
当使用Include()时，您可以获得好处，只需一次调用底层数据存储就可以加载所有数据，例如，如果这是一个远程SQL Server，这将是一个重大的性能提升。

缺点是Include()查询往往会变得*非常复杂**，特别是如果您有任何过滤器的话（Where()呼叫，EF将使用sub-SELECT和APPLY语句生成非常严重的嵌套查询来获取您想要的数据。它的效率也要低得多--您将得到单行数据，其中包含每个可能的子对象列，因此顶层对象的数据将重复很多次。（例如，具有10个子对象的单个父对象将生成10行，每个都有相同的父对象列数据）。我遇到过单个EF查询，它们变得非常复杂，在与EF更新逻辑同时运行时会导致死锁。

Load()方法简单得多。每个查询都是针对单个表的单个、简单、直接的SELECT语句。这些方法在所有可能的方面都要简单得多，* 除了 * 您必须执行其中的许多操作（可能多很多倍）。如果您有集合的嵌套集合，你甚至需要遍历你的顶层对象和Load它们的子对象。这可能会失控。

快速经验法则

尝试避免在单个查询中有任何超过三个Include调用。我发现EF的查询变得太难看了，以至于无法识别;这也符合我对SQL Server查询的经验法则，即在一个查询中最多可以使用四个JOIN语句，但在此之后，就该 * 考虑重构 * 了。
然而，所有这一切仅仅是一个起点。

这取决于您的模式、环境、数据和许多其他因素。

最后，您只需要尝试每种方法。

选择一个合理的“默认”模式来使用，看看它是否足够好，如果不够好，就进行优化。*

赞(0）回复(0）举报 2022-12-20

3bygqnnd3#

Include()将作为JOIN写入SQL：一次数据库往返。
每个Load()-指令都"显式地加载"所请求的实体，因此每个调用一次数据库往返。
因此Include()在这种情况下很可能是更明智的选择，但这取决于数据库布局、调用此代码的频率以及DbContext的寿命。为什么不尝试两种方法，分析查询并比较时间呢？
参见Loading Related Entities。

赞(0）回复(0）举报 2022-12-20

l5tcr1uw4#

我同意@MichaelEdenfield在他的answer中的观点，但我确实想对嵌套集合场景进行评论。您可以通过将查询从里到外翻转来避免必须执行嵌套循环（以及许多由此产生的对数据库的调用）。
您可以使用如下筛选器直接查询OrderItems，而不是向下循环通过Customer的Orders集合，然后再执行另一个嵌套循环通过Order的OrderItems集合。

context.OrderItems.Where(x => x.Order.CustomerId == customerId);

您将获得与嵌套循环中的Loads相同的结果数据，但只需对数据库进行一次调用。
此外，Includes还有一个特殊情况需要考虑。如果父代和子代之间的关系是一对一，那么父代数据被多次返回的问题就不是问题。
我不确定如果大多数情况下没有子节点存在会有什么效果--大量的空值？一对一关系中的稀疏子节点可能更适合我上面概述的直接查询技术。

赞(0）回复(0）举报 2022-12-20

ogsagwnx5#

Include是一个快速加载的示例，其中您不仅加载要查询的实体，而且加载所有相关实体。
Load是EnableLazyLoading的手动覆盖。如果将此设置为false，您仍然可以使用.Load()延迟加载所需的实体

赞(0）回复(0）举报 2022-12-20

hmmo2u0o6#

总是很难决定是使用“渴望”、“显式”还是“懒惰加载”。
无论如何，我推荐的是总是执行一些分析，这是确保您的请求是否可执行的唯一方法。
有很多工具可以帮助你，看看this article from Julie Lerman，她列出了几种不同的分析方法，一个简单的解决方案是启动profiling in your SQL Server Management Studio。
不要犹豫，与DBA（如果您身边有）交谈，这将帮助您理解执行计划。
您还可以查看this presentation，我在其中写了一节关于加载数据和性能的内容。

赞(0）回复(0）举报 2022-12-20

vtwuwzda7#

还有一件事要添加到这个线程中。这取决于你使用的服务器。如果你正在使用sql server，可以使用快速加载，但是对于sqlite，你必须使用.Load（）来避免交叉加载异常，因为sqlite不能处理一些深度超过一个依赖级别的include语句

赞(0）回复(0）举报 2022-12-20