Apache Spark 用于多个变量的 Dataframe 时间戳插值

l5tcr1uw  于 2023-01-31  发布在  Apache
关注(0)|答案(1)|浏览(105)

我有一个包含三列的 Dataframe :timestampvariable_namevaluevariable_name列中总共有10个变量的名称。
我希望有一个单一的 Dataframe ,由时间戳索引,每个变量一列。理想情况下, Dataframe 应该是“满的”,即每个时间戳应该有每个变量的插值。
我一直在努力寻找一种直接的方法来做到这一点(不用在变量列表上循环,等等)。 Dataframe 来自Spark,但是足够小,可以转换成Pandas。任何指针都是最受欢迎的。

b1zrtrql

b1zrtrql1#

就像
df. loc [:,['时间戳','变量名','值']]. pivot(索引='时间戳',列='变量名')
应该可以

相关问题