我正在尝试读取扩展名为CSV的数据集文件,它只有两列:1- URL和2- Lable(恶意或良性)和2行,这是一个来自更大数据集的测试样本,所以我怎么做呢?
csv文件内容:
| https://www.google.com | 无|
| - ------|- ------|
| http://atualizacaodedados.online | 1个|
首先,我导入URI
import java.net.URI;
然后我试着用这个代码:
Scanner dataset = new Scanner(new FileReader("urltest.csv"));
dataset.useDelimiter(",");
URI uri[]= new URI[2];
while(dataset.hasNext()) {
for (int i = 0; i < 2; i++) {
uri[i] = new URI(dataset.next());
System.out.println(uri[i]);
}
}
但它给了我一个错误
Exception in thread "main" java.net.URISyntaxException: Illegal character in scheme name at index 0: https://www.google.com
at java.base/java.net.URI$Parser.fail(URI.java:2966)
at java.base/java.net.URI$Parser.checkChars(URI.java:3137)
at java.base/java.net.URI$Parser.checkChar(URI.java:3147)
at java.base/java.net.URI$Parser.parse(URI.java:3162)
at java.base/java.net.URI.<init>(URI.java:623)
at feturesExtraction2.datasetFile.main(datasetFile.java:22)
1条答案
按热度按时间gz5pxeao1#
你应该这样修剪
也许你需要在使用它之前转换字符串