Pandas.groupby正在返回一个地址

chhkpiq4  于 2022-10-23  发布在  其他
关注(0)|答案(3)|浏览(178)

我真的不明白为什么在为“课程”创建带有groupby的Dataframe时,我会得到一个地址位置输出?
代码:

import pandas as pd
technologies   = ({
    'Courses':["Spark","PySpark","Hadoop","Python","Pandas","Hadoop","Spark","Python","NA"],
    'Fee' :[22000,25000,23000,24000,26000,25000,25000,22000,1500],
    'Duration':['30days','50days','55days','40days','60days','35days','30days','50days','40days'],
    'Discount':[1000,2300,1000,1200,2500,None,1400,1600,0]
          })
df = pd.DataFrame(technologies)
print(df)

df2 =df.groupby(['Courses'])
print(df2)

输出:

Courses    Fee Duration  Discount
0    Spark  22000   30days    1000.0
1  PySpark  25000   50days    2300.0
2   Hadoop  23000   55days    1000.0
3   Python  24000   40days    1200.0
4   Pandas  26000   60days    2500.0
5   Hadoop  25000   35days       NaN
6    Spark  25000   30days    1400.0
7   Python  22000   50days    1600.0
8       NA   1500   40days       0.0
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x00000290E76C40A0>
h6my8fg2

h6my8fg21#

提供一个聚合函数,对要分组的内容执行一些计算。看看下面的例子:https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.groupby.html

df.groupby(['Courses']).size()
Courses
Hadoop     2
NA         1
Pandas     1
PySpark    1
Python     2
Spark      2
dtype: int64
nwlls2ji

nwlls2ji2#

groupby对象存储在存储器中的某个地址。它不会显示任何内容,除非您将函数应用于该对象:聚合、最大值、平均值等。您可以遍历分组对象并打印每个元素。您将看到哪些行与分组值关联。
我希望这有帮助。

sqyvllje

sqyvllje3#

这可能是因为groupby后面应该跟meanmax等操作。
参见取自here的示例

df = pd.DataFrame({'Animal': ['Falcon', 'Falcon',
                          'Parrot', 'Parrot'],
               'Max Speed': [380., 370., 24., 26.]})
df

df.groupby(['Animal']).mean()

相关问题