机器学习PAI

机器学习定义:

机器学习指机器通过统计学算法,对大量的历史数据进行学习从而生成经验模型,利用经验模型指导业务。
目前机器学习主要在以下方面发挥作用:

1. 营销类场景: 商品推荐、用户群体画像、广告精准投放
2. 金融类场景: 贷款发放预测、金融风险控制、股票走势预测、黄金价格预测
3. SNS关系挖掘: 微博粉丝领袖分析、社交关系链分析
4. 文本类场景: 新闻分类、关键词提取、文章摘要、文本内容分析
5. 非结构化数据处理场景: 图片分类、图片文本内容提取OCR
6. 其它各类预测场景: 降雨预测、足球比赛结果预测

笼统地讲,机器学习可以分为三类:

1. 有监督学习(Supervised Learning):
   指每个样本都有对应的期望值,通过模型搭建,完成从输入的特征向量到目标值的映射。
   典型的案例就是回归和分类问题。
2. 无监督学习(Unsupervised Learning):
   指在所有的样本中没有任何目标值,期望从数据本身发现一些潜在的规律,
   例如一些简单的聚类。
3. 增强学习(Reinforcement Learning):
   相对来说比较复杂,是指一个系统和外界环境不断地交互,获得外界反馈,
      然后决定自身的行为,达到长期目标的最优化。
   其中典型的案例就是阿法狗下围棋,或者无人驾驶。

什么是机器学习平台PAI

  • PAI起初是一个定位于服务阿里集团的机器学习平台,致力于让AI技术更加高效、简洁、标准的被公司内部开发者使用。
  • 2015年底PAI作为天池大赛的官方比赛平台在阿里云正式上线,也成为了国内最早的云端机器学习平台之一。
  • 2018年PAI平台正式商业化,目前已经在公有云积累了数万的企业客户以及个人开发者

PAI分为PAI-AutoLearning、PAI-Studio、PAI-DSW、PAI-EAS 4款子产品。其中:

PAI-AutoLearning是个自动化建模平台,
PAI-Studio为拖拽式的模型训练平台,
PAI-DSW为Notebook交互式模型训练平台,
PAI-EAS为模型在线服务平台。