我有一个由3500多行组成的基因组数据集。我需要从其中删除两列中的行(“长度”和“蛋白质名称”)。我如何指定用于此目的的条件。
import csv #importing the csv module or method
#opening a new csv file
file = open('C:\\Users\\Admin\\Downloads\\csv.csv', 'r')
type(file)
#reading the csv file
csvreader = csv.reader(file)
header = []
header = next(csvreader)
print(header)
#extracting rows from the csv file
rows = []
for row in csvreader:
rows.append(row)
print(rows)
我是python生物信息学数据分析的初学者,没有尝试过任何广泛的方法,我不知道如何从这里进行,我已经做了打开和阅读csv文件的工作,我也提取了列标题,但我不知道如何从这里进行,请帮助。
2条答案
按热度按时间b1uwtaje1#
试试这个:
xv8emn3q2#
这将是更好地阅读scv在Pandas,因为你有很多行。这将是明智的决定作出。并设置您的条件变量,您将使用来执行操作。如果这没有帮助。我会建议您提供一个样本数据,您的scv文件。
如果需要,可以将df保存回scv文件: