我尝试使用Python和Pandas将一个csv作为输入,清理数据集,并将输出分配到一个新的csv文件中。原始csv中的一列有商标符号。当我导出新的csv时,列有时会有™而不仅仅是商标符号,或者有时会变成△ △。这就是我导入原始csv和导出新csv的方法:
import pandas as pd
df=pd.read_csv("original_df.csv", encoding='latin1',dtype='unicode')
这是我如何导出一个新的 Dataframe 到csv:
df_new.to_csv('new_test_df.csv', index = False)
如何导出没有额外符号的字符串(即,它在原始字符串中的样子)?
谢谢你!
1条答案
按热度按时间vhmi4jdf1#
刚刚解决了这个相同的问题。答案和解释可以be found here
快速答案是使用编码“utf-8-sig”