我如何在R中自动化子集化一个巨大的 Dataframe ？[已关闭]

nnsrf1az 于 2022-12-06 发布在其他

关注(0)|答案(2)|浏览(144)

已关闭。此问题需要details or clarity。当前不接受答案。
**想要改进此问题吗？**通过editing this post添加详细信息并阐明问题。

2天前关闭。
Improve this question
我的 Dataframe 有很多行（超过200万行），平均每359个样本大约有60，000行。
我的一个列叫做样本，我知道如何根据样本编号对 Dataframe 进行子集化

sample1 <- df[(df$sample ==1), ]

但是，我不确定的是，对于我拥有的359个样本，是否可以使用for循环或某个apply函数来自动执行此操作

for(i in 1:nrow(df)){
       sample(i) <- df[(df$sample == i), ]
       }

因此，输出将是sample 1、sample 2等，直到sample 359，并根据原始文件的sample列进行正确的子集设置。
如果你有任何建议，我会很感激的-谢谢。

2条答案

这不是最好的做法，但这可能对你有用

for(i in 1:nrow(df)){
  assign(value = df[(df$sample == i), ],x = paste0("sample",i),envir = globalenv())
}

split（）很好地满足了我的需求（谢谢你的评论）。
df_samp1〈-拆分（df，f=df$样本==1）