R语言 缺失数据的随机森林建模:寻找不需要插补或数据删除的包或方法

ycl3bljg  于 11个月前  发布在  其他
关注(0)|答案(1)|浏览(90)

**已关闭。**此问题正在寻求书籍,工具,软件库等的建议。它不符合Stack Overflow guidelines。目前不接受答案。

我们不允许您提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题,以便您可以通过事实和引用来回答问题。
7天前关闭
Improve this question
我有一个包含多个变量的数据集,这些变量包含缺失值,我不想插补或丢弃它们。我想在处理缺失观测值的同时,将随机森林模型拟合到此数据。有人能推荐专门用于将随机森林拟合到缺失值数据而无需插补或删除不完整记录的包或方法吗?”

yhived7q

yhived7q1#

两个OSS选择浮现在脑海中:

  • Scikit-Learn >= 1.3.0。参见发行说明。参考文档提到了基本决策树模型,但可以安全地假设集成决策树模型中存在相同的功能。
  • 在“随机森林”模式下的XGBoost。参见XGBRFClassifierXGBRFRegressor类。

请注意,这两个选项都使用最简单的方法来处理缺失值-“将缺失值发送到大多数人的方式”。然而,它仍然优于任何显式插补。

相关问题