我有一个panda Dataframe ,其中一些行包含json数据
| 日期|讯息|
| - ------| - ------|
| 2020年1月1日|{"变量1 ":" foo'}|
| 2020年1月1日|不同含量|
| 2020年1月1日|{' var2':'foo'}|
| 2020年1月2日|非json内容|
| 2020年1月2日|{"变量2 ":"条形图"}|
我想透视表,这样我就有了不同变量的时间序列,例如
| 日期|变量1|变量2|
| - ------| - ------| - ------|
| 2020年1月1日|富|富|
| 2020年1月2日|无/空|棒|
2条答案
按热度按时间dsekswqp1#
使用convert jsons to dict将值转换为
Series
,最后通过GroupBy.first
获取每个日期时间的第一个非缺失值:azpvetkf2#
不确定数据的确切外观,但可以执行以下操作
pd.json_normalize()
解析一些嵌套的json内容groupby()
来获得例如第一个结果下面是一个例子: