我有一个如下所示的Dataframe
colnamedefghijkl列名
基于一个特定的参数,我想把这些值转换成行。例如,如果参数值为3,那么新的dataframe如下所示
COL2COL3ABCDEFGHIJKL公司
但是,如果参数值为4,则如下所示
冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷空气冷
注意以下几点:
列名并不重要
单列中的项数和参数都可以更改
你知道如何在Pypark中实现这一点吗?提前谢谢。
2条答案
按热度按时间4smxwvx51#
您可以添加一些辅助列来透视Dataframe:
wlzqhblo2#
你可以使用
collect_list
以及row_number
为了达到这个目的。第一步:生成一个自定义的行号。
第二步:用这个行号将数据分组并使用
collect_list
创建列表。步骤3:使用python的列表理解从这个列表中选择所有元素。
输出:
注:参数
no_of_columns
可以根据所需的输出列数进行更改。