当前课程知识点:大学计算机基础 >  第十章 IT前沿技术 >  10-4机器学习 >  10-4机器学习

返回《大学计算机基础》慕课在线视频课程列表

10-4机器学习在线视频

下一节:10-5人工智能

返回《大学计算机基础》慕课在线视频列表

10-4机器学习课程教案、知识点、字幕

你也许还不知道什么是机器学习

但在现实生活中

你已经或多或少地从机器学习的研究成果中

获益

这一节我们就介绍一下机器学习的相关技术

什么是机器学习

让我们先来看一些现实生活中机器学习的应用

当我们举起手机拍照的时候

人脸会被框出来

使用智能手机打电话时

可以通过语音进行拨号

门户网站会根据读者的喜好推送新闻

淘宝网购时可以通过找相似,货比三家

马路上的违章驾驶行为发生时

车牌号码会被自动识别等等

这些应用的核心算法就是机器学习领域的内容

机器学习学习英文名称machine learning

在计算机科学领域

machine一般指计算机

机器学习就是让计算机学习的技术

学习是人类在生活过程中通过实践获得

一定的经验和技能的过程

但计算机是死物

怎么可能学习呢

对于逻辑清晰的问题

我们可以依据规则

编写程序

通过指令

指示计算机工作

从而完成我们指定的任务

然而现实生活中的很多问题

因逻辑过于复杂

无法直接建模并编写程序

比如要判断一只动物是不是狗

人在成长和生活过程中积累了很多经验

并定期对这些经验进行归纳之后

获得了一些生活规律

对于这个问题可以轻松作答

但要让机器判断一只动物是不是狗

就不那么容易了

机器学习的思想就是模拟人类在生活中

学习成长的过程

让计算机在数据中学习出规律或模型

然后对新数据进行预测

是一种让计算机利用数据而不是指令

来进行各种工作的方法

例如通过大量数据,计算机对汽车建立了模型

当有新的输入数据要进行判断时

首先进行特征的提取

然后根据计算机建立的模型

就可以给输出要判断的物体是汽车还是

不是汽车

举个例子来说

这张表是美国1790年到1980年

每隔10年的人口统计数据

现在假设要预测2020年美国的人口状况

该如何得到一个合理的结论

我们希望从已知的数据中得到人口与年份

的某种规律

最简单的做法就是先将上面的样本点

在XY坐标系中标出

然后使用线性拟合的方法得到一条

穿过所有样本点的直线

图中这条红色的直线

并且该直线与各个样本点的距离尽可能的小

这条直线表示为数学表达式

就是Y=KX+B其中X表示年份

Y表示人口

K和B是该线性模型的两个参数

根据���有的数据

我们可以确定K和B的值

一旦得到这两个参数的值

人口预测的线性模型也就得到了

从而可以预测出任意一个年份的人口数量

数据拟合的方法有很多种

如果用其他类型的线去拟合,比如二次多项式

可以得到一条更加贴合这些数据点的曲线

就是图中这条红色的曲线

通过这个实例我们知道可以根据一些

已有的历史数据

通过建立模型对未来的数据进行预测

一般来说

当历史数据越多

建立的模型就越可能反应真实的情况

对未来数据的预测效果就可能越好

在机器学习过程中

将使用计算机存储历史数据

并通过学习算法进行处理和建模的过程

称为学习或训练

训练过程中使用的数据称为训练集

训练得到的结果称为模型

学得模型后使用其对新数据进行预测的过程

称为测试

给出新的测试数据

通过模型可以得到测试的结果

被测试的数据称为测试数据

知道了什么是机器学习

那机器学习到底能解决什么问题

及常用的算法有哪些

我们来看一下

近年来互联网特别是移动互联网技术发展迅速

使得数据呈爆炸式增长

机器学习能帮助我们从海量数据中提取出

有价值的信息

对于那些不存在清晰的逻辑的问题

但具有一定数量级的数据

机器学习算法是很好的解决工具

但并非所有的问题都适合用机器学习算法

去解决

从功能上划分

常用机器学习解决的问题

包括分类问题

回归问题

聚类问题以及规则学习

下面我们分别来看一下

首先,分类问题是指根据数据样本中提取出来

的特征

判断其属于有限个已知类别中的哪一类

每类有一个标签标识

这有点像我们日常生活中的垃圾分类一样

常见的应用如:垃圾邮件的识别

对于邮箱中的邮件

识别哪些是垃圾邮件

哪些是正常邮件

信用卡欺诈检测

根据用户的信用卡交易记录

识别哪些交易是持卡用户操作的

哪些不是

语音识别根据用户的话语识别出用户的具体要求

如iPhone的siri程序

字符识别

从手写的字体中识别出其所代表的文字

车牌识别,识别出车牌中的字符

如停车场

出入管理系统

交通监控系统等

常用来处理分类问题的机器学习算法

包括逻辑回归

支持向量机

朴素贝叶斯

深度学习以及随机森林等

常用机器学习解决的第2类问题

回归问题是指根据数据样本中提取出来的特征

为新的未预测的数据

估计出一个连续的值

而不是一个标签

常见的应用如股票交易决策

根据一只股票已有的价格变化

预测其将来的价格

以便为股票操作行为提供决策支持

电影票房预测

根据影片的排片量

票价

上座率等因素

预测电影最终的票房收入

还有房价的预测

根据历史房价数据预测未来的房价

常用来处理回归问题的机器学习算法

包括线性回归

普通最小二乘回归

逐步回归多元

自适应

回归样条等

常用机器学习解决的第三类问题

聚类问题是在不知道数据有哪些类别的情况下

根据数据的相似性以及其他的对数据中的

自然结构的衡量来实现数据的分组

聚类算法通常会将数据集中的样本划分为若干个

不相交的子集

常见的应用如用户群体的划分

根据人脸来管理照片

对Web上的文档进行分类

通过基因的分析

对生物种族进行划分等

常用来处理聚类问题的机器学习算法

包括K-means方法

学习向量量化

高斯混合聚类

密度聚类等

最后一种常用机器学习解决的问题

规则学习是指从训练数据中学习出一组

对于未见示例进行判别的规则

规则语义明确,能描述数据分布所隐含的客观规律

规则学习可以找出数据的属性之间

在统计学上的相关性

如沃尔玛超市曾对其一年多的原始交易数据

进行分析

发现与尿片一起被购买最多的商品竟然是啤酒

根据发现,沃尔玛调整了货架的位置

把尿布和啤酒摆放在一起

从而大大提高了销量

著名的规则学习算法

包括PRISM,CN2,RIPPER等

根据数据类型的不同

对一个问题的建模可以使用不同的方式

下面我们来看一下机器学习方式的划分

机器学习可分为监督学习

无监督学习

半监督学习

和强化学习等

监督学习是指利用一组已知类别的样本

调整分类器的参数

使其达到要求的性能的过程

监督学习需要带有标签的数据作为训练数据

如:一组带有标签的图片

被送入分类器生成预测模型

然后对新的图片样本进行分类

常见的应用场景包括分类问题和回归问题

但现实生活中常常有许多问题是缺乏

足够的先验知识的

因此难以人工标注类别

即使进行人工类别标注

需要的成本也会太高

无监督学习方法有助于解决这一类问题

所谓无监督学习

就是根据类别未知的训练样本

推断出数据的一些内在结构

并解决模式识别中的各种问题

聚类和规则学习都属于无监督学习

如:对于一组没有标签的图片

通过无监督学习将其分成不同的类别

若输入数据部分被标记部分没被标记

这种情况下需要先学习数据的内在结构

先用带标记的数据对分类器进行初始化优化

然后用训练好的分类器对未标记的数据进行

分类

最后将两部分数据一起重新训练分类器

这种学习方式称为半监督学习

半监督学习是监督学习和无监督学习相结合的

一种学习方法

常见的应用场景包括分类问题和回归问题

强化学习又称增强学习,是从动物学习

参数扰动

自适应控制等理论发展而来的

在现实世界中

人类往往是在不断的尝试中领悟

根据行为引起的周围环境的反馈

调整自己下一步的动作和之后的行为模式

强化学习就是仿效这一过程的机器学习模型

强化学习是一种动态学习方法

它没有固定的答案

而是在训练过程中不断通过试错的方法来发现

最优的行为策略

在强化学习下

智能体的动作引起环境的变化

并反馈回智能体

智能体根据反馈作出调整

强化学习

在动态系统

机器人控制等许多领域已经获得了成功的应用

机器学习技术的发展以及其与其他相关技术的

结合

推动了许多智能领域的进步

并改善了人们的生活

机器学习的应用包括计算机视觉

将机器学习与图像处理技术相结合

具体包括人脸识别

车牌识别

手写字符识别

自然语言处理是将机器学习学习与

文本处理技术相结合

使得机器能理解人类的语言

还有机器学习方法与社会网络分析技术的融合

应用于用户画像

热点发现

引文和共引分析

人际传播问题等

个性化推荐

利用机器学习算法

实现自动为用户推荐他们感兴趣的商品或信息

如电影

音乐

新闻等

也是机器学习的应用之一

最后我们总结一下

这小节我们介绍了什么是机器学习

机器学习能解决的问题及常用算法

机器学习方法的划分以及机器学习的应用

谢谢观看

大学计算机基础课程列表:

第一章概述

-1-1 计算机的诞生

--1-1 计算机的诞生

--第一章 习题1

--计算机的诞生1

--计算机的诞生2

-1-2 计算机的分类

--1-2 计算机的分类

--第一章 习题2

--计算机的分类

-1-3 计算机的应用领域

--1-3 计算机的应用领域

--第一章 习题3

--计算机的应用领域1

--计算机的应用领域2

-1-4 计算机系统组成

--1-4 计算机系统组成

--第一章 习题4

--计算机系统组成1

--计算机系统组成2

-1-5 计算机思维的定义

--1-5 计算思维的定义

--第一章 习题5

--计算思维1

-1-6 计算思维的特点

--1-6 计算思维的特点

--第一章 习题6

--计算思维2

-1-7 计算思维的应用案例

--1-7 计算思维的应用案例

--第一章 习题7

--计算思维3

-第一章 章测试

-第一章 讲义

第二章 数据的表示与运算

-2-1 进位计数制表示方法

--2-1 进位计数制表示方法

--第二章 习题1

-2-2 进位计数制的相互转换

--2-2 进位计数制的相互转换

--第二章 习题2

--进位计数制2

-2-3 整数的表示方法

--2-3 整数的表示方法

--第二章 习题3

--整数的表示1

-2-4 浮点数表示方法

--2-4 浮点数表示方法

--第二章 习题4

--浮点数的表示1

-2-5 BCD格式表示法

--2-5 BCD格式表示法

--第二章 习题5

--BCD码

-2-6 算术运算

--2-6 算术运算

--第二章 习题6

-2-7 运算溢出及判断

--2-7 运算溢出及判断

--第二章 习题7

--运算的溢出

-2-8 逻辑运算

--2-8 逻辑运算

--第二章 习题8

--逻辑运算

-2-9 ASCII编码

--2-9 ASCII编码

--第二章 习题9

-2-10 Unicode编码

--2-10 Unicode编码

--第二章 习题10

--ASCII 和 Unicode编码

-2-11汉字编码

--2-11汉字编码

--第二章 习题11

--汉字编码

-2-12数据校验编码

--2-12数据校验编码

--第二章 习题12

--数据校验编码

-第二章 章测试

-第二章 讲义

-信息和数据

第三章 计算机硬件

-3-1中央处理器

--3-1中央处理器

--第三章 习题1

--中央处理器

-3-2 存储器

--3-2 存储器

--第三章 习题2

--存储器1

--存储器2

--存储器3

-3-3 总线和接口

--3-3 总线和接口

--第三章 习题3

--总线

-3-4 外部设备

--3-4 外部设备

--第三章 习题4

--外部设备

-3-5 冯.诺依曼体系结构

--3-5 冯.诺依曼体系结构

--第三章 习题5

--冯.诺依曼体系结构1

--冯诺依曼体系结构2

-3-6 计算机常用性能指标

--3-6 计算机常用性能指标

--第三章 习题6

--性能指标1

--性能指标2

-3-7嵌入式系统

--3-7 嵌入式系统

--第三章 习题7

--嵌入式系统

-3-8哈佛体系结构

--3-8哈佛体系结构

--第三章 习题8

--哈佛体系结构

-3-9 DSP简介

--3-9DSP简介

--第三章 习题9

--DSP

-3-10 虚拟台式计算机模拟器

--3-10 虚拟台式计算机模拟器

--虚拟桌面架构

-3-11 4位计算机模拟器

--3-11 4位计算机模拟器

-第三章 章测试

-第三章 讲义

第四章 计算机软件

-4-1计算机软件分类

--4-1计算机软件分类

--第四章 习题1

--软件分类

-4-2软件的工作模式

--4-2软件的工作模式

--第四章 习题2

--软件的工作模式

-4-3软件的安装方法

--4-3软件的安装方法

--第四章 习题3

--软件安装

-4-4计算机软件生命周期

--4-4计算机软件生命周期

--第四章 习题4

--生命周期1

--生命周期2

--生命周期3

--软件测试1

--软件测试2

-4-5计算机软件开发过程模型

--4-5计算机软件开发过程模型

--第四章 习题5

--软件开发过程模型1

--软件开发过程模型2

- 4-6 常用软件介绍-办公软件

--4-6 常用软件介绍-办公软件

--第四章 习题6

-办公软件实例1 文字处理软件

--办公软件实例1 文字处理软件

-办公软件实例2 电子表格软件

--办公软件实例2 电子表格软件

-办公软件实例3 演示文稿软件

--办公软件实例3 演示文稿软件

-4-7 常用软件介绍-多媒体创作软件

--4-7 常用软件介绍-多媒体创作软件

--第四章 习题7

-多媒体创作软件实例1 音频处理软件

--多媒体创作软件实例1 音频处理软件

-多媒体创作软件实例2 图像处理软件

--多媒体创作软件实例2 图像处理软件

-多媒体创作软件实例3 动画制作软件

--多媒体创作软件实例3 动画制作软件

-多媒体创作软件实例4 视频处理软件

--多媒体创作软件实例4 视频处理软件

-4-8 常用软件介绍-网页制作软件

--4-8 常用软件介绍-网页制作软件

--第四章 习题8

-第四章 章测试

-第四章 讲义

第五章 操作系统

-5-1 操作系统概述

--5-1 操作系统概述

--第五章 习题1

--操作系统

--操作系统分类

--操作系统管理

-5-2 Windows 7基本操作

--5-2 Windows 7基本操作

--第五章 习题2

--windows快捷键

-5-3 Windows 7文件管理

--5-3 Windows 7文件管理

--第五章 习题3

--windows文件后缀名

-5-4 Windows 7程序管理

--5-4 Windows 7程序管理

--第五章 习题4

-5-5 Windows 7系统安全

--5-5 Windows 7系统安全

--第五章 习题5

--操作系统安全

-5-6 Windows 7计算机管理

--5-6 Windows 7计算机管理

--第五章 习题6

-5-7 Dos命令

--5-7 Dos命令

--第五章 习题7

--dos

-5-8 Windows 7常用软件

--5-8 Windows 7常用软件

--第五章 习题8

-5-9 Linux操作系统

--5-9 Linux操作系统

--第五章 习题9

--Linux

-5-10 手机操作系统

--5-10 手机操作系统

--第五章 习题10

-5-11 虚拟机及Vmware介绍

--5-11 虚拟机及Vmware介绍

--第五章 习题11

--虚拟机

--虚拟机使用

-第五章 章测试

-第五章 讲义

第六章 算法与程序设计

-6-1 算法基础

--6-1 算法基础

--第六章 习题1

-6-2 程序设计语言分类

--6-2 程序设计语言分类

--第六章 习题2

-6-3 程序设计过程

--6-3 程序设计过程

--第六章 习题3

-6-4 程序设计方法

--6-4 程序设计方法

--第六章 习题4

-6-5 程序设计语言基本要素(一)

--6-5 程序设计语言基本要素(一)

--第六章 习题5

-6-6 程序设计语言基本要素(二)

--6-6 程序设计语言基本要素(二)

--第六章 习题6

-6-7 Python简介及编程环境配置

--6-7 Python简介及编程环境配置

--第六章 习题7

-6-8 程序设计应用举例

--6-8 程序设计应用举例

--第六章 习题8

-第六章 章测验

-第六章 讲义

第七章 数据库技术

-7-1 数据库技术概述

--7-1 数据库技术概述

--第七章 习题1

--信息和数据

-7-2 数据库管理系统

--7-2 数据库管理系统

--第七章 习题2

--数据库管理系统

-7-3 数据库系统的组成与功能

--7-3 数据库系统的组成与功能

--第七章 习题3

--独立性

--数据库系统分类

-7-4 关系模型的数据结构

--7-4 关系模型的数据结构

--第七章 习题4

--E-R图

--三级模式结构

-7-5 关系模型的数据操作及完整性约束

--7-5 关系模型的数据操作及完整性约束

--第七章 习题5

--关系模型

--数据库范式

--完整性约束

-7-6 Access数据库的建立

--7-6 Access数据库的建立

--第七章 习题6

--Access

-7-7 Access的数据查询

--7-7 Access的数据查询

--第七章 习题7

-第七章 章测试

-第七章 讲义

第八章 计算机网络

-8-1计算机网络概述

--8-1计算机网络概述

--第八章 习题1

--定义

-8-2网络分类

--8-2网络分类

--第八章 习题2

--分类

-8-3数据传输

--8-3数据传输

--第八章 习题3

--数据传输

-8-4网络拓扑结构

--8-4网络拓扑结构

--第八章 习题4

--网络拓扑结构

-8-5网络体系结构

--8-5网络体系结构

--第八章 习题5

--网络体系结构

-8-6网络互连

--8-6网络互连

--第八章 习题6

--网络互连

-8-7Internet基础:TCP╱IP协议结构

--8-7Internet基础:TCP╱IP协议结构

--第八章 习题7

--TCP/IP模型

--IP协议

-8-8Internet基础:IP地址

--8-8Internet基础:IP地址

--第八章 习题8

--IP地址

-8-9Internet基础:域名系统

--8-9Internet基础:域名系统

--第八章 习题9

--域名

-8-10Internet基础:Internet的基本服务

--8-10Internet基础:Internet的基本服务

--第八章 习题10

--Internet

-8-11Internet基础:Internet的接入

--8-11Internet基础:Internet的接入

--第八章 习题11

--Internet接入

-第八章 章测试

-第八章 讲义

第九章 信息安全

-9-1信息安全的基本概念

--9-1信息安全的基本概念

--第九章 习题1

--信息安全的CIA

--攻击与防御

-9-2 密码技术及应用

--9-2 密码技术及应用

--第九章 习题2

--对称加密与非对称加密

--数字签名

-9-3防火墙技术

--9-3防火墙技术

--第九章 习题3

--防火墙的分类

--防火墙的基本特性

-9-4恶意软件

--9-4恶意软件

--第九章 习题4

--恶意软件类型

--分布式拒绝服务攻击

-9-5入侵检测技术

--9-5入侵检测技术

--第九章 习题5

--入侵检测概念原理

--入侵检测分类

-第九章 章测试

-第九章 讲义

第十章 IT前沿技术

-10-1 云计算

--10-1 云计算

--第十章 习题1

-10-2大数据

--10-2大数据

--第十章 习题2

-10-3物联网

--10-3物联网

--第十章 习题3

-10-4机器学习

--10-4机器学习

--第十章 习题4

-10-5人工智能

--10-5人工智能

--第十章 习题5

-10-6物联网应用

--10-6物联网应用

-第十章 章测验

-第十章 讲义

实验教程 1 计算机组装

-1-0 准备步骤

--1-0 准备步骤

-1-1 台式机组装

--1-1 台式机组装

-1-2 笔记本电脑组装

--1-2 笔记本电脑组装

实验教程 3 文字处理

-3-1 启动和退出Word

--启动和退出Word

-3-2 创建、编辑和保存Word文档

--创建、编辑和保存Word文档

-3-3 封面的制作

--封面的制作-1

--封面的制作-2

--封面的制作-3

--封面的制作-4

-3-4 长文档编辑

--长文档编辑

-3-5 页面插入与目录

--页面插入与目录-1

--页面插入与目录-2

-3-6 页眉页脚与页码

--页眉页脚与页码-1

--页眉页脚与页码-2

-3-7 完成文档

--完成文档与打印预览

实验教程 4 电子表格

-4-1 创建和编辑Excel表格

--4-1 创建和编辑Excel表格

-4-2 简单公式和函数

--4-2 简单公式和函数

-4-3 插入图表

--4-3 插入图表

-4-4 电子表格中数据的管理

--4-4 电子表格中数据的管理

实验教程 5 演示文稿

-5-1 创建演示文稿与添加幻灯片

--5-1 创建演示文稿与添加幻灯片

-5-2 编辑演示文稿

--5-2 编辑演示文稿

-5-3 设置演示文稿外观

--5-3 设置演示文稿外观

-5-4 交互式演示文稿的设置

--5-4 交互式演示文稿的设置

-5-5 设置演示文稿动画和音乐

--5-5 设置演示文稿动画和音乐

-5-6 演示文稿放映

--5-6 演示文稿放映

实验教程 6 图像处理

-6-1 图像的修饰

--6-1 图像的修饰

-6-2 淡黄色的记忆

--6-2 淡黄色的记忆

-6-3 心形贺卡

--6-3 心形贺卡

-6-4 燃烧字

--6-4 燃烧字

-6-5 闻味的小狗狗

--6-5 闻味的小狗狗

-6-6 换脸

--6-6 换脸

实验教程 7 动画制作

-7-1 逐帧动画的制作

--7-1 逐帧动画的制作

-7-2 动作补间动画的制作

--7-2 动作补间动画的制作

-7-3 形状补间动画的制作

--7-3 形状补间动画的制作

实验教程 8 网页制作

-8-1 网站制作前期工作

--8-1 网站制作前期工作

-8-2 在Dreamweaver中建立和管理站点

--8-2 在Dreamweaver中建立和管理站点

-8-3设计制作网站主页

--8-3 设计制作网站主页

-8-4 制作网站导航栏

--8-4 制作网站导航栏

-8-5 修饰美化页面

--8-5 修饰美化页面

-8-6 填写页面内容

--8-6 填写页面内容

-8-7 设计制作次级页面并建立链接

--8-7 设计制作次级页面并建立链接

实验教程 9 程序设计

-9-1 Python的下载

--9-1 Python的下载

-9-2 Python的安装

--9-2 Python的安装

-9-3 IDLE的使用

--9-3 IDLE的使用

-9-4 求矩形的周长和面积

--9-4 求矩形的周长和面积

-9-5 求三角形的面积

--9-5 求三角形的面积

-9-6 求素数

--9-6 求素数

实验教程 10 Access数据库系统

-10-1 数据库的建立

--10-1 数据库的建立

-10-2 SQL的应用

--10-2 SQL的应用

实验教程 11 计算机网络

-11-1 Packet Tracer简介及下载方法

--11-1 Packet Tracer简介及下载方法

-11-2 有线网络的组网与配置

--11-2 有线网络的组网与配置

-11-3 无线网络的组网及无线路由配置

--11-3 无线网络的组网及无线路由配置

实验教程 12 无线网络安全配置

-12 无线网络安全配置

--12 无线网络安全配置

10-4机器学习笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。