假设我有一个包含以下变量和值的 Dataframe :
| 识别号|体重|LR重量|UR重量|年龄|LS年龄|美国年龄|身高|LS高度|美国身高|
| - ------|- ------|- ------|- ------|- ------|- ------|- ------|- ------|- ------|- ------|
| 1个|六十三|五十|八十|二十个|十八|二十一|一百六十五|一百六十|一百七十五|
| 第二章|七十五|五十|八十|二十二|十八|二十一|一百七十二|一百六十|一百七十|
| 三个|四十九|四十五|八十|十七|十八|二十一|一百八十|一百六十|一百八十|
我想创建以下附加变量:
| 识别号|标志_重量|标志_年龄|标志_高度|
| - ------|- ------|- ------|- ------|
| 1个|1个|1个|1个|
| 第二章|1个|无|无|
| 三个|1个|无|1个|
这些标志表示主变量值(例如:体重、年龄和身高)在相应的下限或上限之间,下限或上限可能以不同的2位数字开始(在此 Dataframe 中,我给出了四个示例:LR,UR,LS,US,但在我的真实的 Dataframe 中我有更多),并且它们的极限值有时随ID而不同。
你能帮我做这些旗子吗?
先谢谢你。
2条答案
按热度按时间nbysray51#
因此,如果我理解正确的话,您需要使用这些新变量添加列,最简单的解决方案是df.insert()。
你可以把它做成这样:
df.insert(number of column after which you want to insert the new column, name of the column, values of the new column)
你可以用任何你能想到的方法来构造新的值,比如复制一列或者简单的数学运算,比如+,-,*,/,都可以,但是你也可以apply一个完整的函数,它会根据你的条件返回标志作为新列的值。
如果新的列n可以被追加,你甚至可以像这样创建一个新列:
希望这能帮上忙。
bvjxkvbb2#
您可以使用临时
MultiIndex
:输出: