下面是我的框架和代码,当框架的大小增加时,所花费的时间会显著增加。这是怎么回事?如何将其矢量化?
import pandas as pd
import numpy as np
data = {
'delta_t': np.random.randint(0, 301, 100),
'specimen': np.random.choice(['X', 'Y', 'Z'], 100),
'measuremnt': np.random.rand(100),
'lag': np.random.rand(100)
}
df = pd.DataFrame(data)
# Defining the q75 function
def q75(x):
return x.quantile(0.75)
# Applying the given code
df_result = df.groupby(['specimen', 'delta_t']).agg({
'measuremnt': ['mean', q75, 'max'],
'lag': 'mean'
}).reset_index()
字符串
1条答案
按热度按时间slmsl1lt1#
如评论所述,像这样做一个懒惰的groupby:
字符串
输出量:
型
与您的代码相比:
型
如果你想要一个MultiIndex,传递元组作为键:
型