我想从相同的数据中得到2个向量子集,replace=TRUE
。
即使两个向量可以包含相同的值,它们也不能在同一索引位置相同。
举例来说:
> set.seed(1)
> a <- sample(15, 10, replace=T)
> b <- sample(15, 10, replace=T)
> a
[1] 4 6 9 14 4 14 15 10 10 1
> b
[1] 4 3 11 6 12 8 11 15 6 12
> a==b
[1] TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
在这种情况下,向量a
和b
在索引1处包含相同的值(值==4),这对我的目的来说是错误的。
有没有简单的方法来纠正这一点?
可以在subset
步骤上完成吗?
或者我应该通过一个循环一个元素一个元素地检查,如果值是相同的,再选择一个b[i]
,然后再检查一次,如果它不是相同的 *ad infinite *?
多谢!
2条答案
按热度按时间xwbd5t1u1#
我的想法是,而不是得到2个样本的长度10与更换,得到10个样本的长度2没有更换
l
中的每个元素都是长度为2的整数向量。这两个整数肯定是不同的,因为我们在sample
中指定了replace=FALSE
mrphzbgm2#
两阶段抽样程序如何
我们首先画出样本
a
;然后,对于来自a
的每个样本,我们从值x
* 的集合中提取新样本,其中不包括来自a
的当前样本。由于我们一次只做一个样本,因此我们自动允许带替换的采样。