我正试图在databricks集群中实现spark程序,并遵循以下文档链接:
现在,在这行代码之后:
def mapKeyToVal(mapping):
def mapKeyToVal_(col):
return mapping.get(col)
return udf(mapKeyToVal_, StringType())
我用这个:
gameInfDf = gameInfDf.withColumn("country_code", mapKeyToVal(countryCodeMap)("country"))
我得到了一个错误:名称'countrycodemap'没有定义
如果有人能帮我,那就太好了。
1条答案
按热度按时间1sbrub3j1#
https://databricks.com/blog/2018/07/09/analyze-games-from-european-soccer-leagues-with-apache-spark-and-databricks.html 是databricks的正式指南。
见下图。您需要单击lkink并导入.dbc
然后你会看到各种各样的设置。e、 g.需要的Map。好东西。
你可以看到Map,其中一些: