我正在尝试通过www.example.com _csv导入一个文件pd.read。这也很好用。只有我有这样的问题,即在源文件中有几个同名的列:Row A, Row B, Row B, Row C
但是,在导入过程中只考虑第一列。相应的DataFrame看起来像这样:Row A, Row B, Row C
我需要一个解决方案,进口所有黑桃,但重命名他们,如果必要的。比如说Row A, Row B_1, Row B_2, Row C
我现在使用以下代码:
df = pd.read_csv('new.csv', header = 0, usecols = ["Row A", "Row B", "Row B", "Row C"], sep = ',')
在原始文件中重命名列的功能并不实用。这是因为列B可以根据您的需要经常出现。
我也试
df = pd.read_csv('new.csv', header = 0, usecols = ["Row A", "Row B", "Row B", "Row C"], sep = ',')
但结果还是一样。
先谢谢你。奥利弗
3条答案
按热度按时间r6vfmomb1#
您可以首先将CSV读取为文本,修改标题行以使每个列名唯一,然后将其读入DataFrame。
rks48beu2#
column2 = df['Row B'] column3 = df['Row B.1']
l2osamch3#
非常感谢.我学到了很多,也发现了另一种可能性,我在我的程序中实现了:我导入了除“B”列以外的所有列。然后我使用lambda函数导入所有“B”列,最后我合并了两者: