当用Pandas的填充词来填充na时,有没有一种方法可以添加前缀?我有一个包含分类学信息的数据框架,如下所示:
| Kingdom | Phylum | Class | Order | Family | Genus |
| Bacteria | Firmicutes | Bacilli | Lactobacillales | Lactobacillaceae | Lactobacillus |
| Bacteria | Bacteroidetes | Bacteroidia | Bacteroidales | | |
| Bacteria | Bacteroidetes | | | | |
由于不是所有的分类群都能被完全分类,所以我有一些空的单元格。用NA替换空格,然后使用ffill,我可以用每一行中最后一个有效的字符串填充这些单元格,但是我想在这些单元格中添加一个字符串(例如“Unknown_Bacteroidales”),这样我就可以识别哪些单元格被结转。
到目前为止,我尝试了taxa_formatted = "unknown_" + taxonomy.fillna(method='ffill', axis=1)
,但这当然会将“unknown_”前缀添加到 Dataframe 中的所有内容。
3条答案
按热度按时间8tntrjer1#
您可以将
boolean masking
与df.isna
配合使用。您可以在此处使用
df.add
。fdx2calv2#
您需要使用
mask
和update
:kwvwclae3#