所以基本上,我需要处理一个巨大的数据集。
我在dataframe中提取了两个不同变量的表,以获得Frequency。
例如:
table1<-table(df1$vehicletype,df1$company)
# let's say table 1 looks something like this
1 2 3 4 5 6 7
1 1 2 3 1 2 6 4
2 3 4 3 4 1 2 3
3 4 6 3 5 6 7 8
table2<-table(df1$vehicletype2,df1$company2)
1 3 4 5 6 7
1 3 1 4 1 5 6
2 6 3 6 2 0 0
3 4 3 6 3 2 1
现在我想合并这两个表,虽然表2中只有6列(第二列缺失),我想将相应的值加在一起,表应该看起来像这样:
因此,基本上,我希望能够检测到在这两天中,共有9辆车使用了vehicletype 2和vehiclecompany 1。我希望函数能够理解,在第二天根本没有使用来自公司2的汽车,并且仅将值0用于列。
真实的的案例场景没有被简化,它跨越了更大的时间范围,并且有更多的表需要添加缺少的列和行。
有谁知道吗?
谢谢你
我尝试了不同的东西,我发现在StackOverflow,不能解决这个问题。
2条答案
按热度按时间q0qdq0h21#
在R基地你可以
ecfsfe2w2#
另一种选择是在制表之前排列数据:
即
然后,您可以创建具有相同维度的表: