pandas 当我尝试读取.txt并格式化为panda Dataframe 时,出现额外的点(.)

plupiseo  于 2022-12-21  发布在  其他
关注(0)|答案(1)|浏览(133)

我正在尝试从. txt文件中读取一组数据,
它看起来像这样(顺便说一句,原始数据来自excel,然后复制到. txt文件中)。

0.789   0.439   0.440
0.792   0.440   0.456
0.797   0.432   0.449

然后我用

df = pd.read_csv(filename, '\t')

来读取文件。

df.loc[-1] = df.columns
        df.index = df.index + 1  # shifting index
        df.sort_index(inplace=True)
        df = df.astype(float)

然后我试图改变我之前读到的数据的类型,变成float,这就是我得到一个错误的地方:
ValueError:无法将字符串转换为浮点型:'0.439.1'
这很奇怪,因为我在任何地方都没有这样的数据,我不禁想到这个点是在源代码的某个地方生成的。
奇怪的是,当我尝试不同的数据集时,它起作用了。
帮帮我吧。我不知道。
我寻找奇怪的数据,以防我做错什么,我什么也没找到。

twh00eeo

twh00eeo1#

.1是典型的列名重复数据删除,这意味着部分数据作为头文件处理。
使用header=None可以避免这种情况:

df = pd.read_csv(filename, sep='\t', header=None)

相关问题