如何修复在Weka中打开CSV时的“索引越界”错误?

new9mtju  于 2023-06-19  发布在  其他
关注(0)|答案(1)|浏览(127)

error message
我无法在weka https://www.kaggle.com/datasets/parisrohan/credit-score-classification?resource=download中打开这个数据集文件,因为我得到了这个错误:索引28超出长度28界限在线路上遇到问题:378
我尝试使用数据集文件和weka转换器的清理版本,但不起作用

abithluo

abithluo1#

Weka的CSVLoader不喜欢连续的双引号。其他电子表格应用程序,如LibreOffice Calc或MS Excel,在单元格中使用双引号来转义它们(参见RFC4180,第2.6节)。
使用Weka的最快方法是手动将这些双引号("")替换为单引号('):

  • 使用文本编辑器(记事本、记事本++、vi、emacs等)打开CSV文件
  • """替换为"'**
  • ""替换为'
  • 保存CSV文件
    **理论上,您需要区分单元格开头(,"""-> ,"')和结尾(""",-> '",)的三重引号。但是在单元格的末尾似乎没有任何三重引号,所以上面的方法是可行的。

相关问题