error message
我无法在weka https://www.kaggle.com/datasets/parisrohan/credit-score-classification?resource=download中打开这个数据集文件,因为我得到了这个错误:索引28超出长度28界限在线路上遇到问题:378
我尝试使用数据集文件和weka转换器的清理版本,但不起作用
error message
我无法在weka https://www.kaggle.com/datasets/parisrohan/credit-score-classification?resource=download中打开这个数据集文件,因为我得到了这个错误:索引28超出长度28界限在线路上遇到问题:378
我尝试使用数据集文件和weka转换器的清理版本,但不起作用
1条答案
按热度按时间abithluo1#
Weka的CSVLoader不喜欢连续的双引号。其他电子表格应用程序,如LibreOffice Calc或MS Excel,在单元格中使用双引号来转义它们(参见RFC4180,第2.6节)。
使用Weka的最快方法是手动将这些双引号(
""
)替换为单引号('
):"""
替换为"'
**""
替换为'
**理论上,您需要区分单元格开头(
,"""
->,"'
)和结尾(""",
->'",
)的三重引号。但是在单元格的末尾似乎没有任何三重引号,所以上面的方法是可行的。