我想知道在PySpark中使用reset_index()命令与在Pandas中使用reset_index()命令的等价性。当使用默认命令(reset_index)时,如下所示:
reset_index()
reset_index
data.reset_index()
我得到一个错误:"DataFrame"对象没有属性"reset_index"错误"
3pmvbmvn1#
与前面提到的其他注解一样,如果确实需要为DF添加索引,可以用途:
from pyspark.sql.functions import monotonically_increasing_id df = df.withColumn("index_column",monotonically_increasing_id())
1条答案
按热度按时间3pmvbmvn1#
与前面提到的其他注解一样,如果确实需要为DF添加索引,可以用途: