我尝试从Pyspark中的Pandas UDF返回一个StructField,该UDF与聚合一起使用,函数签名如下:
def parcel_to_polygon(geom:pd.Series,entity_ids:pd.Series) -> Tuple[int,str,List[List[str]]]:
但结果是不支持返回类型。有没有其他方法可以实现同样的效果?我可以创建三个Pandas udf并返回原始类型,这是可行的,但函数逻辑在这三个函数中重复,这是我试图避免的(假设它会更好地执行,也许我错了)。
1条答案
按热度按时间jv4diomz1#
可以将所有值作为 Dataframe 返回,如下所示