由于NetCDF 4文件很大,当我想将其转换为Pandas Dataframe 时,我得到了一个MemoryError。但我不需要netCDF 4文件中的所有内容,所以我想知道是否可以在转换为 Dataframe 之前和之后剪切该文件我的文件看起来像这样:
xr表示xarray库时间变量包含从2019-01-01到2019-01-31的所有小时不幸的是,我无法在哥白尼网站上过滤,但我只需要09:00:00的时间你知道我是怎么做的吗?用xarray库或者其他方法。谢谢
toe950271#
您可以使用sel过滤数据集:
sel
import pandas as pd import xarray as xr import datetime # Load a demo dataset ds = xr.tutorial.load_dataset('air_temperature') # Keep only 12:00 rows df = ds.sel(time=datetime.time(12)).to_dataframe()
输出:
>>> df air lat time lon 75.0 2013-01-01 12:00:00 200.0 242.299988 202.5 242.199997 205.0 242.299988 207.5 242.500000 210.0 242.889999 ... ... 15.0 2014-12-31 12:00:00 320.0 296.889984 322.5 296.589996 325.0 295.690002 327.5 295.489990 330.0 295.190002 [967250 rows x 1 columns]
1条答案
按热度按时间toe950271#
您可以使用
sel
过滤数据集:输出: