x1c 0d1x的数据
图7.1统计学习简介
我目前正在学习一本名为《统计学习入门》的书,其中包含R语言的应用程序,并将解决方案转换为Python语言。
我不知道如何得到置信区间,并绘制他们如上图所示(虚线)。我已经绘制了线。这是我的代码-(我使用多项式回归预测- '年龄'和响应- '工资',度为4)
poly = PolynomialFeatures(4)
X = poly.fit_transform(data['age'].to_frame())
y = data['wage']
# X.shape
model = sm.OLS(y,X).fit()
print(model.summary())
# So, what we want here is not only the final line, but also the standart error related to the line
# TO find that we need to calcualte the predictions for some values of age
test_ages = np.linspace(data['age'].min(),data['age'].max(),100)
X_test = poly.transform(test_ages.reshape(-1,1))
pred = model.predict(X_test)
plt.figure(figsize = (12,8))
plt.scatter(data['age'],data['wage'],facecolors='none', edgecolors='darkgray')
plt.plot(test_ages,pred)
字符串
这里的数据是在R中可用的工资数据。这是我得到的结果图-
的
3条答案
按热度按时间llmtgqce1#
我使用引导来计算置信区间,为此我使用了一个自适应模块-
字符串
上述模块可用作-
型
这将给我们给予置信区间下限和置信区间上限。
型
结果图为
x1c 0d1x的数据
bxpogfeg2#
以下代码结果在95%置信区间内
字符串
pes8fvy93#
我用sklearn修改了上面的答案,使其更容易阅读(至少对我来说)。
字符串
的数据