Apache Spark 用于多个变量的 Dataframe 时间戳插值

l5tcr1uw 于 2023-01-31 发布在 Apache

关注(0)|答案(1)|浏览(105)

我有一个包含三列的 Dataframe ：timestamp、variable_name和value。variable_name列中总共有10个变量的名称。
我希望有一个单一的 Dataframe ，由时间戳索引，每个变量一列。理想情况下， Dataframe 应该是“满的”，即每个时间戳应该有每个变量的插值。
我一直在努力寻找一种直接的方法来做到这一点（不用在变量列表上循环，等等）。 Dataframe 来自Spark，但是足够小，可以转换成Pandas。任何指针都是最受欢迎的。

apache-spark

来源：https://stackoverflow.com/questions/75284052/dataframe-timestamp-interpolation-for-multiple-variables