R - data.matrix(),将因子保持为因子?

jvlzgdj9  于 2023-02-01  发布在  其他
关注(0)|答案(1)|浏览(109)

抱歉,我不知道该从哪里问。
我正在尝试对一个数据集进行交叉验证,我尝试将预测因子作为整数和因子(有人建议我两者都要做)。
我使用glmnetUtils包中的cva. glmnet()进行交叉验证,但是,将预测值转换为data. matrix会将所有因子转换为整数(根据link文档,"Logical and factor columns conversion to integer")。
如何运行交叉验证并将我的因子保留为因子?使用

cva.glmnet([outcome] ~ [predictors], family = "binomial")

不起作用,因为数据集有1550行和74,417列,并且该方法在超过8小时后未完成。
如果我能用我的GPU来加速,那就太好了,但我还没有找到这样做的方法。
任何帮助都很感激。
抱歉,没有可复制的数据,但我不知道如何使一个数据集这么大容易。
谢谢你。

j7dteeu8

j7dteeu81#

您的数据大小对于cva.glmnet函数来说太大了。我的建议是将您的预测器减少到信息量最大的预测器。为此,您可以尝试像递归方法这样的功能选择方法。也许插入符号包会有帮助,因为它有很好的函数来帮助减少功能。

相关问题