如何在python中使用reset_index()的Pyspark等价函数

jmo0nnb3  于 2023-02-01  发布在  Python
关注(0)|答案(1)|浏览(140)

我想知道在PySpark中使用reset_index()命令与在Pandas中使用reset_index()命令的等价性。当使用默认命令(reset_index)时,如下所示:

data.reset_index()

我得到一个错误:
"DataFrame"对象没有属性"reset_index"错误"

3pmvbmvn

3pmvbmvn1#

与前面提到的其他注解一样,如果确实需要为DF添加索引,可以用途:

from pyspark.sql.functions import monotonically_increasing_id

df = df.withColumn("index_column",monotonically_increasing_id())

相关问题