我有一个CSV文件,其中包含一列'url'和一列'label'。我有另一个CSV文件,其中包含上述URL的一个子集,具有正确的标签,我想将正确的标签传输到主CSV文件。对于主CSV中的每个URL,也在第二个CSV中,我想在第二个CSV中找到包含该URL的行,并将该标签分配给主文件中的URL。这是我第一次使用pandas,到目前为止我的想法还没有奏效。这可能不需要显式的for循环吗?
pandas
nr9pn0ug1#
正如你所描述的,2个文件中的字段是相同的,否则它不起作用。正如经常发生的那样,有不同的方法来做同样的事情。我同意@algebruh的评论,df.update是最短的方法。下面的代码:
df1 = pd.read_csv('csv1.csv') df2 = pd.read_csv('csv2.csv') df1.set_index('url', inplace=True) df1.update(df2.set_index('url')) df1.reset_index()
字符串我希望能对你有所帮助
1条答案
按热度按时间nr9pn0ug1#
正如你所描述的,2个文件中的字段是相同的,否则它不起作用。正如经常发生的那样,有不同的方法来做同样的事情。我同意@algebruh的评论,df.update是最短的方法。下面的代码:
字符串
我希望能对你有所帮助