人工智能学习之线性回归
目录
人工智能常见流程
机器思维和人的思维方式对比如下图:
算法与模型的本质
阶段 | 白话 | 本质 | 掌握 |
---|---|---|---|
数据 | 学什么 | xy | 数据预处理、特征工程 |
算法 | 怎么学 | 公式 | 机器学习、深度学习等算法 |
模型 | 学到的规律 | 参数 | 各种最优化算法、模型评估 |
预测 | 学以致用 | 传入新的x,计算新的y | 模型压缩、模型上线 |
机器学习不同的学习方式
人工智能、机器学习、深度学习、强化学习之间的关系
根据训练期间接受的监督数量和监督类型,可以将机器学习系统的分成一下四个主要类别:
- 有监督学习
- 无监督学习
- 半监督学习
- 强化学习
监督学习
在有监督学习中,提供给算法的包含所需解决方案的训练集称为标签。
主要任务:
- 分类,如:垃圾邮件
- 回归,如:给定一组成为预测器的特征(里程、使用年限、品牌)来预测目标数值(车的价格)。
常见的有监督学习算法:
- k-近邻算法
- 线性回归
- 逻辑回归
- 支持向量机(SVM)
- 决策树和决策森林
- 神经网络
无监督学习
无监督学习的训练数据都是没有进过标记的。
主要任务:
- 聚类
- 本质:更具样本和样本之间的相似性来归堆
- 目标:将一批数据划分到多个组
- 应用:用户分组、异常检测、前景背景分离
- 降维
- 本质:去掉冗余信息或噪声
- 目标:将数据的维度减少
- 应用:数据的预处理,可视化,提高模型的计算速度
常见的额无监督学习算法:
- 聚类算法
- k-均值算法
- DBSCAN
- 分层类聚分析(HCA)
- 异常检测和新颖性检测
- 单类SVM
- 孤立森林
- 可视化和降维
- 主成分分析(PCA)
- 核主成分分析
- 局部线性嵌入(LLE)
- t-分布随机近邻嵌入(t-SNE)
- 关联规则学习
- Apriori
- Eclat