我想打开csv,如果文件已在该位置创建,具有相同的文件名,否则创建新的csv,以记录我的python刮取数据

ppcbkaq5  于 2022-12-06  发布在  Python
关注(0)|答案(1)|浏览(124)

我想打开CSV,如果一个文件已经在该位置创建了相同的文件名,否则创建在新的CSV记录我的刮数据与标题,但如果文件已经创建,它应该只记录数据,而不是重复标题再次在同一CSV文件在python代码刮和保存数据从多个文章,并保存在一个CSV.

# =============== Data Store +++++++++++++++++++++
Data = [[Category,Headlines,Author,Source,Published_Date,Feature_Image,Content,url]]
try:
    df = pd.DataFrame (Data, columns = ['Category','Headlines','Author','Source','Published_Date','Feature_Image','Content','URL'])
    print(df)
    with open('C:/Users/Public/pagedata.csv', 'a') as f:
        df.to_csv(f, header=False)
except:
    df = pd.DataFrame (Data, columns = ['Category','Headlines','Author','Source','Published_Date','Feature_Image','Content','URL'])
    print(df)
    df.to_csv('C:/Users/Public/pagedata.csv', header=True)
gab6jxml

gab6jxml1#

你可以在try/except中把代码分成两部分。首先你试着检查带有db的文件是否存在--如果存在,你可以同时把新数据连接到旧数据上。如果不存在,你只是在创建新数据(头默认为True)。

cols = ['Category','Headlines','Author','Source','Published_Date','Feature_Image','Content','URL']
try:
    opened_df = pd.read_csv('C:/Users/Public/pagedata.csv')
    opened_df = pd.concat([opened_df,pd.DataFrame(Data, columns = cols)])
except:
    opened_df = pd.DataFrame(Data, columns = cols)

opened_df.to_csv('C:/Users/Public/pagedata.csv',index=False)

相关问题