我正在尝试读取以下数据集:https://data.opensanctions.org/datasets/20230620/default/names.txt
我运行了这个代码:
filename = "https://data.opensanctions.org/datasets/20230620/default/names.txt"
df = pd.read_csv(filename, encoding='latin1', nrows = 2, header=None)
print(df)
dataframe看起来像这样:
0
0 SANAVBARI NIKITENKO
1 ÐÐÐÐÐТ Ð ÐÐÐÐÐÐÐÐÐ ÐÐ¥ÐÐÐÐ...
当我读入文件时,如何自动检测特殊字符类型?
1条答案
按热度按时间fdbelqdn1#
对于我的工作删除
encoding='latin1'
,所以使用默认的encoding='utf-8'
: