人工智能学习之基础
目录
人工智能常见流程
机器思维和人的思维方式对比如下图:
算法与模型的本质
阶段 | 白话 | 本质 | 掌握 |
---|---|---|---|
数据 | 学什么 | xy | 数据预处理、特征工程 |
算法 | 怎么学 | 公式 | 机器学习、深度学习等算法 |
模型 | 学到的规律 | 参数 | 各种最优化算法、模型评估 |
预测 | 学以致用 | 传入新的x,计算新的y | 模型压缩、模型上线 |
机器学习不同的学习方式
人工智能、机器学习、深度学习、强化学习之间的关系
根据训练期间接受的监督数量和监督类型,可以将机器学习系统的分成一下几种主要类别:
- 有监督学习
- 无监督学习
- 半监督学习
- 强化学习
- 批量学习
- 在线学习
监督学习
在有监督学习中,提供给算法的包含所需解决方案的训练集称为标签。
主要任务:
- 分类,如:垃圾邮件
- 回归,如:给定一组成为预测器的特征(里程、使用年限、品牌)来预测目标数值(车的价格)。
常见的有监督学习算法:
- k-近邻算法
- 线性回归
- 逻辑回归
- 支持向量机(SVM)
- 决策树和决策森林
- 神经网络
无监督学习
无监督学习的训练数据都是没有进过标记的。
主要任务:
- 聚类
- 本质:更具样本和样本之间的相似性来归堆
- 目标:将一批数据划分到多个组
- 应用:用户分组、异常检测、前景背景分离
- 降维
- 本质:去掉冗余信息或噪声
- 目标:将数据的维度减少
- 应用:数据的预处理,可视化,提高模型的计算速度
常见的额无监督学习算法:
- 聚类算法
- k-均值算法
- DBSCAN
- 分层类聚分析(HCA)
- 异常检测和新颖性检测
- 单类SVM
- 孤立森林
- 可视化和降维
- 主成分分析(PCA)
- 核主成分分析
- 局部线性嵌入(LLE)
- t-分布随机近邻嵌入(t-SNE)
- 关联规则学习
- Apriori
- Eclat
半监督学习
标记少量数据,有些算法可以处理部分已标记的内容,这样被称为半监督学习。
大多数的半监督学习算法是无监督学习算法和有监督学习算法的结合。比如深度信念网络(DBN)是基于一种互相堆叠的无监督租金,这种组件叫做设限玻尔兹曼机(RBM)。首先玻尔兹曼机以无监督的方式进行训练,然后使用监督学习技术对整个系统进行微调。