我想写一段代码(用几行),同时在Product
和Purchase_cost
,warranty_years
和service_cost
上运行t检验。
# dataset
import pandas as pd
from scipy.stats import ttest_ind
data = {'Product': ['laptop', 'printer','printer','printer','laptop','printer','laptop','laptop','printer','printer'],
'Purchase_cost': [120.09, 150.45, 300.12, 450.11, 200.55,175.89,124.12,113.12,143.33,375.65],
'Warranty_years':[3,2,2,1,4,1,2,3,1,2],
'service_cost': [5,5,10,4,7,10,4,6,12,3]
}
df = pd.DataFrame(data)
print(df)
字符串
代码尝试为Product
和Purchase_cost
。我想运行t-测试为Product
和warranty_years
和Product
和service cost
#define samples
group1 = df[df['Product']=='laptop']
group2 = df[df['Product']=='printer']
#perform independent two sample t-test
ttest_ind(group1['Purchase_cost'], group2['Purchase_cost'])
型
1条答案
按热度按时间wlp8pajw1#
ttest_ind
可以在2D(ND)输入上工作:字符串
如果不是,你可以使用一个字典理解循环你的列:
型
输出量:
型
泛化到更多对
如果您的产品不仅仅是笔记本电脑/打印机,并且希望比较所有配对,您可以概括为:
型
带有额外类别的输出示例(电话):
型