我真的不明白为什么在为“课程”创建带有groupby的Dataframe时,我会得到一个地址位置输出?
代码:
import pandas as pd
technologies = ({
'Courses':["Spark","PySpark","Hadoop","Python","Pandas","Hadoop","Spark","Python","NA"],
'Fee' :[22000,25000,23000,24000,26000,25000,25000,22000,1500],
'Duration':['30days','50days','55days','40days','60days','35days','30days','50days','40days'],
'Discount':[1000,2300,1000,1200,2500,None,1400,1600,0]
})
df = pd.DataFrame(technologies)
print(df)
df2 =df.groupby(['Courses'])
print(df2)
输出:
Courses Fee Duration Discount
0 Spark 22000 30days 1000.0
1 PySpark 25000 50days 2300.0
2 Hadoop 23000 55days 1000.0
3 Python 24000 40days 1200.0
4 Pandas 26000 60days 2500.0
5 Hadoop 25000 35days NaN
6 Spark 25000 30days 1400.0
7 Python 22000 50days 1600.0
8 NA 1500 40days 0.0
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x00000290E76C40A0>
3条答案
按热度按时间h6my8fg21#
提供一个聚合函数,对要分组的内容执行一些计算。看看下面的例子:https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.groupby.html
nwlls2ji2#
groupby对象存储在存储器中的某个地址。它不会显示任何内容,除非您将函数应用于该对象:聚合、最大值、平均值等。您可以遍历分组对象并打印每个元素。您将看到哪些行与分组值关联。
我希望这有帮助。
sqyvllje3#
这可能是因为
groupby
后面应该跟mean
、max
等操作。参见取自here的示例