我的文件夹中有大约2000个CSV文件。我想按时间顺序读一读。他们用数字命名,所以我想这一定很容易。
我用下面的代码来阅读它们。我可以想象一个非常简单的解决方案,因为必须有一个简单的参数。但我没有找到任何东西:((
def csv_to_df():
dff_all_from_csv = []
for root, dirs, files in os.walk("output/csv_files"):
for file in files:
df = pd.read_csv(os.path.join(root, file))
dff_all_from_csv.append(df)
return dff_all_from_csv
我真的很感激你的帮助!谢谢
5条答案
按热度按时间gkl3eglg1#
您可以
split
* filename* 并使用词干/数字作为sorting
key
:或者从natsort使用
natsorted
:egmofgnx2#
您可以尝试:
dsekswqp3#
您可以使用
pathlib
和lstat
属性按创建时间(st_ctime
)或修改时间(st_mtime
)对文件进行排序:epggiuax4#
您可以使用
os.path.getmtime()
检索csv文件的日期。您可以将创建日期添加到可排序的列表中。然后你可以从排序列表中打开 Dataframe 。fhity93d5#
我尝试了这样的东西,它工作得很好: