我正在使用tidymodels方法创建一个随机森林模型。在recipe函数中,我得到了这个错误/警告,我根本无法解释,但它必须与创建的汇总变量相关。错误是
There are new levels in a factor: NA
所以,现在我的食谱参数看起来像这样:
era.af.Al_rec <- recipes::recipe(logRR ~., data = era.af.Al_predict) %>%
step_mutate_at(logRR, SubPrName, PrName, Product, AEZ16simple, fn = factor) %>%
update_role(ID, new_role = "ID") %>%
update_role(RR_group, new_role = "ID") %>%
step_other(SubPrName, PrName, Product, AEZ16simple, threshold = 0.01) %>%
step_other(Site.ID, threshold = 0.001) %>%
step_dummy(all_nominal(), -all_outcomes()) %>%
step_downsample(logRR)
era.af.Al_prep <- prep(era.af.Al_rec)
juiced <- juice(era.af.Al_prep)
错误在_prep调用中弹出。
1条答案
按热度按时间ruoxqz4g1#
我有过类似的病例。这是一个warning ejected乘
step_dummy()
,警告我添加了一个新的因子水平,在本例中,新水平为NA。这来自分类列中的缺失数据。我可以简单地忽略这个错误,因为这是我想要的;向所述伪编码添加新的NA级别。或者,我可以在
step_dummy()
之前添加step_unknown()
步骤。step_unknown(all_nominal_predictors(),new_level =“NA”)