好吧,我正试图从Spotify数据库打开一个CSV文件,以使用其顺序跳过预测数据集。但是他的行和列有问题我不知道怎么解决。我最多能做的就是打开table,忽略一些问题,但它仍然变得非常bug。
链接是这样的:
Link for Spotify Sequential Skip Prediction Challange
我试图访问的文件是这样的:
Training_Set_And_Track_Features_Mini(17.2 MB)
我在这里使用了这段代码,这是我设法打开它所做的:
import pandas as pd
# path csv
path_file = '/content/drive/MyDrive/TESTE TCC/training mini/16772e7f-7871-4d42-a44f-5f399f40fd94_training_set_track_features_mini'
# Open CSV
data = pd.read_csv(file_path, encoding='latin1', error_bad_lines=False)
# display the data
data
但即便如此,它还是有很多缺陷,而且所有的列都很奇怪
1条答案
按热度按时间ego6inou1#
这是一个tar.gz归档文件,您需要在使用之前提取它:
为此,运行以下shell命令:
这将创建一个包含CSV文件的
data
文件夹。然后,从你的python脚本/notebook: