如何使用pyspark实现?给定一个包含姓名、年龄和城市的输入数据集,如果年龄〉18,请添加一个新列,用"Y"或"N"填充。
1.列表项
解决这使用apache pyspark
输入文本文件:
苏米特,30岁,班加罗尔卡皮尔,32岁,海得拉巴萨蒂什,16岁,金奈拉维,39岁,班加罗尔卡维塔,12岁,海得拉巴卡维亚,19岁,迈 solr
输出:
苏米特,30,班加罗尔,Y卡皮尔,32,海得拉巴,Y萨蒂什,16,钦奈,N拉维,39,班加罗尔,Y卡维塔,12,海得拉巴,N卡维亚,19,迈 solr ,Y
1条答案
按热度按时间dfuffjeb1#
我想你应该
age
向DataFrame添加新列并写入输出