💜这篇博客是机器学习PAI的实践部分,主要演示的是分类算法在平台上的使用方法,对往期内容感兴趣的小伙伴可以查看一下内容👇:
💖自己动手学完一遍之后,发现这个平台所提供的功能太强大了,主流的模型方法,特征工程,评估方法等很全面。让我们开始今日的学习吧!
实验借助葡萄酒的11种指标并通过线性支持向量机和逻辑回归多分类方法对不同类别的葡萄酒建立模型,检验此模型效果,以此达到通过模型可以预测葡萄酒类别的目的。
实验目标:对原始数据上已有的标签(即classification字段,该字段有3-9共7个类别)进行分类,为消除量纲而进行归一化操作后进行切分比例为0.8的拆分,用80%的数据进行分析建模,用剩余20%的数据对建立的模型进行检验,具体通过查看这20%的数据在classification字段上的准确率(即模型预测出的类别和这葡萄酒本身的类别符合程度)的方式明确模型效果
--3、4、5、6一类和7、8、9一类,分别标为0和1
select
fixed_acidity,volatile_acidity,citric_acid,suger,chlorides,
free_sul_dio,total_sul_dio,density,ph,sulphates,alcohol,
(case when classification > 6 then 1 else 0 end) as grade
from ${t1}
拆分组件有两个输出口,左边输出口为用来建模的80%数据,右边输出口为预测的20%数据。
多分类实践和二分类一样的,主要的区别在于导入数据那一块,我们可以指定分成几类,比如为3、4、5一类,6、7一类,8、9一类,然后采用sql语句设置标签列。
《阿里云全球培训中心》
《机器学习PAI平台产品手册》
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://liuxiaocong.blog.csdn.net/article/details/122776728
内容来源于网络,如有侵权,请联系作者删除!