我有从csv
导入的数据,它们存储在列表列表中:
data=[['1', ' 1.013831', ' 1.713332', ' 1.327002', ' 3.674446', ' 19.995361', ' 09:44:24', ' 2.659884'], ['2', ' 1.013862', ' 1.713164', ' 1.326761', ' 3.662183', ' 19.996973', ' 09:49:27', ' 2.668791'], ['3', ' 1.013817', ' 1.712084', ' 1.326192', ' 3.658077', ' 19.997608', ' 09:54:27', ' 2.671786']]
我想得到一个numpy
数组,这样我就可以真正使用正确的切片(我不想要pandas
或其他任何东西,只是普通的旧numpy
数组与适当的数据类型-不是对象)。
所以我试了一个显而易见的方法:
arr=np.array(data,dtype='i4,f4,f4,f4,f4,f4,U8,f4')
只为得到:
ValueError: invalid literal for int() with base 10: ' 1.013831'
这表明numpy
将行视为列,将列视为行。该怎么办呢?我还尝试输入而不是data
list(map(tuple,data))
,这给出了map object is not callable
和我尝试的错误:
arr=np.asarray(tuple(map(tuple,data)),dtype='i4,f4,f4,f4,f4,f4,U8,f4')
给
ValueError: could not assign tuple of length 20 to structure with 8 fields.
注意,在我的例子中,原始的行数是20。
那么,如何将数据从csv
导入numpy
数组,并指定每列的数据类型?
1条答案
按热度按时间aij0ehis1#
根据文档中的示例,
输出量: