我如何在R中自动化子集化一个巨大的 Dataframe ?[已关闭]

nnsrf1az  于 2022-12-06  发布在  其他
关注(0)|答案(2)|浏览(144)

已关闭。此问题需要details or clarity。当前不接受答案。
**想要改进此问题吗?**通过editing this post添加详细信息并阐明问题。

2天前关闭。
Improve this question
我的 Dataframe 有很多行(超过200万行),平均每359个样本大约有60,000行。
我的一个列叫做样本,我知道如何根据样本编号对 Dataframe 进行子集化

sample1 <- df[(df$sample ==1), ]

但是,我不确定的是,对于我拥有的359个样本,是否可以使用for循环或某个apply函数来自动执行此操作

for(i in 1:nrow(df)){
       sample(i) <- df[(df$sample == i), ]
       }

因此,输出将是sample 1、sample 2等,直到sample 359,并根据原始文件的sample列进行正确的子集设置。
如果你有任何建议,我会很感激的-谢谢。

pxy2qtax

pxy2qtax1#

这不是最好的做法,但这可能对你有用

for(i in 1:nrow(df)){
  assign(value = df[(df$sample == i), ],x = paste0("sample",i),envir = globalenv())
}
5cnsuln7

5cnsuln72#

split()很好地满足了我的需求(谢谢你的评论)。
df_samp1〈-拆分(df,f=df$样本==1)

相关问题