我正在将我的代码转换为pyspark。请找到下面的示例,还有什么方法可以转换为pyspark?我在pyspark中看不到shift。下面代码的主要用途是检查下一行,并在不相等时累加求和。
example['date_next'] = example.groupby("A")['date'].shift(-1).reset_index()
s = example[['A',
'B',
'C',
'D']].ne(example[['A','B','C','D']].shift(1)).any(axis=1).cumsum()
先谢谢你了
1条答案
按热度按时间vof42yt11#
不那么直接。使用数组会简化。请参阅下面的逻辑和代码