它不是关于唯一id的,所以我不打算使用increase unique number api,而是尝试通过定制查询来解决它
考虑给定值30,现在是当前Dataframe df
需要添加一个名为 hop_number
因此,列中从上到下的每个字段将从30开始递增2,因此
with 2 parameters
x -> start number, here is 30
y -> like step or offset, here is 2
hop_number
---------------
30
32
34
36
38
40
......
我知道在rdd我们可以用 map
但是如何在Dataframe中以最小的成本完成同样的工作呢?
df.column("hop_number", 30 + map(x => x + 2)) // pseudo code
2条答案
按热度按时间ahy6op9u1#
检查以下代码。
hpcdzsge2#
假设您有一个分组和排序列,您可以使用window函数。
结果是:
如果您需要不同的方法,请提供Dataframe的示例数据。