阿里云机器学习平台PAI之理论基础

x33g5p2x  于2022-02-07 转载在 其他  
字(1.7k)|赞(0)|评价(0)|浏览(527)

🍓在前几章的学习中,我们学习了阿里云系列的计算平台MaxComputer、大数据治理和分析平台DataWorks和可视化平台Quick BI,今天进入阿里云大数据的最后部分的学习——机器学习平台PAI,对往期内容感兴趣的小伙伴可以参考如下内容👇:

🍏在这一部分中,我们依旧分为理论学习和实践操作两个部分,本文是理论理论学习的部分。好了,让我们开始今日份的学习吧。

实践部分也在一天内做完了,链接在下面:

链接: 阿里云机器学习平台PAI之分类实践.

1. 机器学习平台PAI的简介

阿里云机器学习平台PAI ( Platform of Artificial Intelligence ):是构建在阿里云MaxCompute计算平台之上,集数据处理、建模、离线预测、 在线预测为一体的机器学习平台。为算法开发者提供了 丰富的MPI、PS、BSP等编程框架和数据存储接口,同时提供了基于WEB的可视化控制台,降低了使用门槛。
主要的的特点有:

  1. 可视化操作界面:通过对底层分布式算法的封装,提供拖、拉、拽、的可视化操作环境。使机器学习的创建过程像是堆积木一样简单。
  2. 算法丰富:提供特征过程、数据预处理、统计分析、机器学习、深度学习框架、预测评估等几百种算法组件。
  3. 一站式体验:提供模型训练功能,还提供在线预测功能以及离线调度功能,让机器学习训练结果和业务可以无缝衔接。
  4. 多种计算框架:流计算Flink、深度学习Tensorflow、大规模并行计算Parameter Server以及Spark、Pyspark、MapReduce等主流框架。

2. 产品架构

产品架构如图所示:

我们主要需要关注的是:各种机器学习产品PAI-Studio、PAI-DSW、PAI-DLC、PAI AutoLearning他们的功能如下:

2.1 PAI AutoLearning自动学习

PAI AutoLearning自动化建模平台拟在为用户提供低门槛的偏场景化的机器学习建模服务,目前该平台已经内置了图像分类、推荐召回两款经典的机器学习业务场景,用户只需要在产品中做些基础的配置,无需对机器学习建模理论有深入的了解即可完成模型训练。

2.2 PAI-Studio可视化建模

PAl-Studio可视化建模拖拽式建模平台为开发者提供可视化的机器学习实验开发环境,帮助用户实现无代码开发人工智能相关服务。内置数百个成熟的机器学习算法,覆盖商品推荐、金融风控、广告预测等场景,满足用户不同程度的需求,即开即用。

2.3 PAI-DSW交互式建模

PAI-DSW交互式建模平台基于原生JupyterLab做了大量定制化工作,可以实现交互式的建模工作。支持用户绑定自己的云存储资源,同时底层可以灵活动态的选用不同类型的GPU机器。

2.4 PAI-DLC深度学习训练平台

PAI-DLC (Deep Leaming Containers) 是基于阿里巴巴容器服务ACK (Alibaba Cloud Container Service for Kubernetes) 的深度学习训练平台,为您提供灵活、稳定、易用和极致性能的深度学习训练环境。

2.5 PAI-EAS在线服务部署

PAI-EAS模型在线服务引擎提供了机器学习模型在线服务,支持基于异构硬件(CPU/GPU)的模型加载和数据请求的实时响应。用户可以将Studio、DSW、Autolearning服务生成的模型一键发布到PAI-EAS形成Restful服务,通过EAS服务与业务系统打通,解决模型和客户业务最后一公里的问题。

3.参考资料

《阿里云全球培训中心》
《机器学习PAI平台产品手册》

相关文章