我如何在csv文件中 Shuffle 数据?

hjzp0vay  于 2023-09-27  发布在  其他
关注(0)|答案(1)|浏览(97)

I have the following dataFrame
数据是从csv文件,我想在每一行 Shuffle
这是我导入csv文件的代码

df = pd.read_csv('data1.csv',header=None, names=cols)
    df1 = df[['kac']]
    print(df1)

这个怎么办?
我想打乱csv文件的行

uqcuzwp8

uqcuzwp81#

答案很简单:

df_shuffled = df.sample(frac=1, random_state=42).reset_index(drop=True)

但这里面有一个基本的概念!让我们来谈谈什么是真实的的随机和什么是pheroaradom。
真实随机数:

  • 随机性:即每个数字彼此独立,并以相等的概率被选中。
  • 不可预测性:这很容易理解,你永远无法预测随机数生成器产生的下一个值。
  • 非重现性:这意味着您创建的号码无法再次创建。

伪随机数具有随机性,但不能保证不可预测性和不可再现性
那么下一个问题->正常的计算机会产生真正的随机数吗?
普通计算机无法产生随机数。通常的方法是先用一个随机种子,然后用某种算法(https://en.wikipedia.org/wiki/Pseudorandom_number_generator)产生不满足不可重复性的“随机”数。
那么接下来,有没有其他方法来生成真正的随机数?如果有的话,我们为什么不使用这种方法来生成随机数,供我们日常编码使用呢?
是的,我们可以使用一些硬件来帮助我们生成一些随机因子来生成真正的随机数,但是生成它的成本太高,或者生成它的速度太慢。
因此,除非您的算法或场景与加密相关,否则不需要使用真随机数。
因此,即使问题已经得到了回答,我们可能也想深入研究细节,以真正了解它是如何工作的。特别是,这个概念在我们的编码生活中非常基本和重要。
我希望这将在未来帮助你。如果我错了,请让我知道,我会修改答案。
缩略语:

  • 伪随机数发生器(PRNG)
  • 真随机数发生器

相关问题