pandas 使用Python的NetCDF 4文件- Dataframe 化前过滤

x6yk4ghg  于 2023-01-15  发布在  Python
关注(0)|答案(1)|浏览(131)

由于NetCDF 4文件很大,当我想将其转换为Pandas Dataframe 时,我得到了一个MemoryError。但我不需要netCDF 4文件中的所有内容,所以我想知道是否可以在转换为 Dataframe 之前和之后剪切该文件
我的文件看起来像这样:

xr表示xarray库时间变量包含从2019-01-01到2019-01-31的所有小时不幸的是,我无法在哥白尼网站上过滤,但我只需要09:00:00的时间
你知道我是怎么做的吗?用xarray库或者其他方法。
谢谢

toe95027

toe950271#

您可以使用sel过滤数据集:

import pandas as pd
import xarray as xr
import datetime

# Load a demo dataset
ds = xr.tutorial.load_dataset('air_temperature')

# Keep only 12:00 rows
df = ds.sel(time=datetime.time(12)).to_dataframe()

输出:

>>> df
                                       air
lat  time                lon              
75.0 2013-01-01 12:00:00 200.0  242.299988
                         202.5  242.199997
                         205.0  242.299988
                         207.5  242.500000
                         210.0  242.889999
...                                    ...
15.0 2014-12-31 12:00:00 320.0  296.889984
                         322.5  296.589996
                         325.0  295.690002
                         327.5  295.489990
                         330.0  295.190002

[967250 rows x 1 columns]

相关问题