如何使用panda或CSV类型模块解析此行
col1, col2, col3 <br>
name, date, ["data"] <br>
name, date, ["data", "data2", "data3"] <br>
name, date, ["data1", "data2"] <br>
字符串
这是该文件的格式。
如果我使用
pd.read_csv(file)
型
我得到这个错误
pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 3, saw 5
型
3条答案
按热度按时间cotxawn71#
尝试使用
delimiter=', (?![^\[]*[\]])'
忽略方括号之间的逗号,字符串
输出:
型
要删除
<br>
,型
kuuvgm7e2#
由于第三列包含字符串格式的数据,请考虑使用
StringIO
和converters
参数,该参数将字符串表示转换为实际的列表。字符串
beq87vna3#
另一种可能的解决方案:
字符串
输出量:
型