我正在使用Python,我需要将.csv导入的数据分为两部分,训练集和测试集,例如70%的训练和30%的测试。
我不断得到各种错误,如'list' object is not callable
等。
有什么简单的方法吗?
谢谢
编辑:
代码是基本的,我只是想分割数据集。
from csv import reader
with open('C:/Dataset.csv', 'r') as f:
data = list(reader(f)) #Imports the CSV
data[0:1] ( data )
字符串TypeError: 'list' object is not callable
个
4条答案
按热度按时间bxjv4tth1#
可以使用
pandas
:字符串
cwdobuhd2#
更好的做法,也许更随机的是使用
df.sample
:字符串
5t7ly7z53#
你应该使用pandas模块中的
read_csv ()
函数。它直接将你所有的数据读入到你可以进一步使用的框架中,以将你的数据分解为训练和测试。同样,你可以使用scikit-learn模块中的train_test_split()
函数。aij0ehis4#
你应该使用
sklearn.model_selection.train_test_split
作为它的分割数据集的最佳目的下面我给代码使用它`
字符串
`
假设您的CSV包含2列,一列用于问题,另一列用于答案