我有一个数据框
df =
C1 C2
a. 2
d. 8
d. 5
d. 5
b. 3
b. 4
c. 5
a. 6
b. 7
我想要取所有C1中的值的计数〈= 2的行,并添加一个低的新col,否则保留原始值,所以新的df将如下所示:
df_new =
C1 C2 type
a. 2 low
d. 8 d
d. 5 d
d. 5 d
b. 3. b
b. 4 b
c. 5. low
a. 6. low
b. 7 b
我该怎么做呢?
我还想得到一个所有低的类型的列表(这里是['a ','c'])
谢啦,谢啦
1条答案
按热度按时间qco9c6ql1#
你可以使用
pandas.DataFrame.groupby
并计算每组中'C1'
的值,然后在pandas.DataFrame.transform
中使用lambda
并返回low
或该组的原始值,或者我们可以在groupby
的结果上使用numpy.where
。输出: