我希望将数据框中的数据拆分并移动到包含NAN的列中
从pdf中读取数据并创建表格后,输出为:
Output
| Summary | Prior Years|1|2|3|4| 5 |6|7|8|9|10| Total |
|---------------------|-------------|-|-|-|-|---|-|-|-|-|--|---------|
|Total Value 3,700,000| 110 |-|-|-|5|NaN|-|-|-|-|--|3,815,000|
|Total Value 320,000 | 110 |-|-|-|5|NaN|-|-|-|-|--| 435,000 |
由于采用PDF格式,读取数据会导致第一列将‘Total Value’和‘Preor Year’的期望值组合在一起
Expected Output
| Summary |Prior Years| 1 |2|3|4|5|6|7|8|9|10| Total |
|-----------|-----------|---|-|-|-|-|-|-|-|-|--|---------|
|Total Value| 3,700,000 |110|-|-|-|5|-|-|-|-|--|3,815,000|
|Total Value| 320,000 |110|-|-|-|5|-|-|-|-|--| 435,000 |
包含NAN的‘5’列之后的所有数据都与预期一致
有没有一种方法可以拆分“摘要”列中的数据,并让所有数据转移,直到NAN列被占用?
4条答案
按热度按时间wqnecbli1#
仅填充通过轴=1
之后,您可以轻松地将4列替换为np.nan
t2a7ltrp2#
这里有一个方法可以做到这一点。基于所述的假设,即第5列的值将从左移位,而汇总列将分为两列
ghg1uchk3#
我不确定您的所有列都是什么dtype,但应该可以使用下面这样的代码:
fslejnso4#
您是否尝试使用
df.shift()
:在您的
periods_to_be_shifted = 1
案例中,请尝试以下操作: