我使用databricks上的pyspark对dataset进行了以下总结
订单月EARSALEAAMOUNT2012-11-01t00:00:00.000+0000473760.5700000012010-04-01t00:00:00.000+0000490967.0900000001
将ordermonthyear转换为整数类型时,此Map函数出现Dataframe错误
results = summary.map(lambda r: (int(r.OrderMonthYear.replace('-','')), r.SaleAmount)).toDF(["OrderMonthYear","SaleAmount"])
有什么想法吗?
AttributeError: 'DataFrame' object has no attribute 'map'
1条答案
按热度按时间igetnqfo1#
在这里找到了pyspark日期yyyy-mmm-dd转换的解决方案
谢谢@mck的帮助!干杯