我有一个简单的pandas时间序列框架类似于这个:
In [69]: df
Out[69]:
A B
Date
2015-01-01 NaN NaN
2015-02-01 1.1 NaN
2015-03-01 NaN NaN
2015-04-01 1.2 NaN
2015-05-01 1.5 1.2
2015-06-01 1.6 1.9
2015-07-01 1.3 NaN
2015-08-01 1.2 3.0
2015-09-01 1.1 1.1
字符串
从第一个所有列都有值的点开始获取数据框的最佳方法是什么,即以编程方式获取此输出?
In [71]: df.ix[4:]
Out[71]:
A B
Date
2015-05-01 1.5 1.2
2015-06-01 1.6 1.9
2015-07-01 1.3 NaN
2015-08-01 1.2 3.0
2015-09-01 1.1 1.1
型
3条答案
按热度按时间lbsnaicq1#
可以使用
.first_valid_index()
获取列的第一个非NaN索引。字符串
dgtucam12#
你可以使用
dropna
的默认行为,并使用第一个索引来切片你的df:字符串
所以这是可行的,因为它会删除所有包含单个
NaN
的行,所以你只需要使用第一个索引值来切片df:型
t5zmwmid3#
您可以获取非空数据子集的第一个索引值(跨行,或轴=1)。然后使用
.ix
从该索引值向前选择所有数据。字符串