机器学习-概述

发表于 2019-02-09 分类于教程本文字数： 1.4k 阅读时长 ≈ 5 分钟

机器学习是一门能够让编程计算机从数据中学习的计算机科学。
一个计算机程序在完成任务T之后，获得经验E，其表现效果为P，如果随着任务的增加，其表征经验的效果也能随之增加，即P与T成正增长关系，这样的系统就是一个机器学习系统。

什么是机器学习

人工智能，智能手机也算智能，通过编写逻辑智能就可以称之为人工智能
机器学习，是从现有流程中学习经验
深度学习，由神经网络算法构建的机器学习模型

按照学习方式划分：有监督学习、无监督学习、半监督学习、强化学习

有监督学习：用已知输出评估模型的性能；考试选择题：给出标准答案
无监督学习：在没有已知输出的情况下，仅仅根据输入信息的相关性，进行类别的划分；考试写作文：没有标准答案
半监督学习：先通过无监督学习划分类别，再根据人工标记通过有监督学习预测输出。
强化学习：通过对不同决策结果的奖励和惩罚，使机器学习系统在经过足够长时间的训练以后，越来越倾向于给出接近期望结果的输出。类似于小孩，做对了，会得到夸奖，做错了，会得到惩罚。

按照学习过程划分：批量学习、增量学习

按照学习策略划分：基于实例的学习，基于模型的学习

实例学习：根据以往的经验，寻找与待预测输入最接近的样本，以其输出作为预测结果。

年龄学历经验性别月薪

25 硕士 2 女 10000

20 本科 3 8000

… … … … …

20 本科 3 男？
模型学习：根据以往的经验，建立用于联系输出和输入的某种数学模型，将待预测输入代入该模型，预测其结果。

输入输出

1 2

2 4

3 6

… …

2x =Y

… …

9? 18

graph LR
A[数据收集] --> B[数据清洗]
B --> C[数据预处理]
C --> D[选择模型]
D --> E[训练模型]
E --> F[验证模型]
F --> G[使用模型]
G --> H[维护模型]

数据处理

机器学习

业务运维

股价预测、推荐引擎、自然语言识别、语音识别、图像识别、人脸识别