我有一个字典,它有多个格式为{movieid':[val1,val2]}的唯一键和值。我想用max val1和min val2打印电影ID。val1是由女性给出的等级,val2是由男性给出的等级。有什么建议/解决方案吗?在hadoopmapreduce中使用pythonMap器和reducer。
bxgwgixi1#
您不需要使用hadoop:
>>> data = {'614d5a7ed90f43e5b062dbc3afa7f5b1': [7, 14], 'aa9b80ae387e40f5bc351c3ec3f82143': [9, 7], '49f2c238c2f144fab4468faa091e4620': [13, 18], '1c9ea5622aef41e696102d49eb59691e': [17, 18], '8a86455812eb48e4a7c8b13e55192a3f': [5, 18], 'ad5e4bc4b729432482fec1d03510caee': [8, 9], '6ace5755bff2410db2dcf1a45202b273': [11, 16], '571c38be6f0a4748b2400def38f7443c': [1, 6], 'd110b65111bf4737b3ca5a4c10fbd420': [11, 11], '6f6c930ea04d468c934be7c78a739ec8': [13, 13]} >>> max(data, key=lambda x: abs(data[x][1]-data[x][0])) #ID with greatest difference '8a86455812eb48e4a7c8b13e55192a3f' >>>
1条答案
按热度按时间bxgwgixi1#
您不需要使用hadoop: