9162038

当前课程知识点:线性代数(2) >  第六讲:伪逆 >  6.3 最小二乘法 >  6.3 最小二乘法

返回《线性代数(2)》慕课在线视频课程列表

6.3 最小二乘法在线视频

6.3 最小二乘法

下一节:第六讲讲义

返回《线性代数(2)》慕课在线视频列表

6.3 最小二乘法课程教案、知识点、字幕

我们再回到求解线性方程组

我们说线性方程组Ax等于b有解

当且仅当常数向量b

落在系数矩阵A的列空间里

当常数向量b落在C(A)里时

b可以由A的列向量去线性表示

表示的系列

就被方程组的解X所表达出来

那么当方程组有解

特别地A是列满秩的时候

常数向量b被A的列向量的系数

是唯一的

也就对应着方程组有唯一的解

特别地的情况

当系数矩阵A是可逆时

有唯一解X等于(A^-1)b

那么我们说线性方程组

Ax等于b没有解

那当且仅当常数向量b

不落在A的列空间里

此时呢我们想要去求近似解

我们关心什么样的近似解

我们关心误差向量的长度

来得最小的近似解

我们叫是最小二乘解

所以误差向量是指的

有了近似解x^之后

常数向量b减掉Ax^

这个向量我们叫误差向量

我们从图上容易看出来

C(A)是子空间

那么常数向量b

不落在C(A)里头

对应着线性方程组Ax等于b

没有解

那么我们找到一个近似解x^

Ax^是A的列向量的线性组合

所以Ax^这个向量

是落在C(A)这个子空间中的

我们叫它是p向量

那么b减掉Ax^

这个向量我们叫是误差向量

我们希望误差向量e的长度

来得最小

从这个图上可以看出来

当且仅当

e是垂直于子空间C(A)的

那我们又知道m维的向量空间

R^m是写成A的列空间

正交直和上A的左零空间

如果误差向量垂直于A的列空间

那么也就是说误差向量

落在A的左零空间N(A^T)里

那么也就是说

A^T乘以e应该是等于0

那也就是A^T

乘以(b - Ax^)等于0

那么也就是A^TAx^

等于A^Tb

这个方程就是之前

我们在介绍最小二乘法时的

所谓正规方程

如果线性线性方程组Ax等于b

没有解

我们关注最小二乘解

那么就转化成去求解正规方程

特殊的情况

如果系数矩阵A是列满秩时

也就是A的秩等于A的列数n

这时我们来看A^TA

这个矩阵的秩是等于A的秩

等于n

那么我们再来重复说一下

A^TA的秩等于A的秩

那么这件事情是因为

A^TAx=0

这个齐次线性方程组与Ax=0

这个齐次线性方程组

是同解方程组

很容易看到Ax=0

我们一定有A^TAx=0

那么A^TAx=0

我们两边去乘以x^T

仍然是等于0

而这个式子就化成

Ax这个向量的模长平方等于0

那么一个向量的长度平方等于0

这个向量Ax就一定等于0

这样这两个齐次线性方程组

是同解的

那么它们的解空间的维数

应该是相等的

这两个方程组解空间的维数

分别是n减到系数矩阵的秩

那么也就得到

系数矩阵(A^)A的秩等于A的秩

当A是列满秩时

A的秩是等于n

从而(A^)TA的秩也等于n

而A^TA是一个n阶的方阵

它的秩等于n的话

它是一个可逆矩阵

那么我们的正规方程

(A^)TAx^等于A^Tb

这个方程 系数矩阵可逆

于是它就有唯一的解

x^等于A^TA逆矩阵

乘以A^Tb

也就是说

我们有唯一的最小二乘解

这件事情从下面的图里

也容易看得出来

当A的秩等于n时

A的零空间只有零向量

那么R^n是等于A的行空间

另外一边

R^m可以写成A的列空间

正交直和上A的左零空间

仍给一个m维向量b

如果它不落在A的列空间里

那么奇次线性方程组Ax等于b

没有解

b可以作正交直和分解

b写成p+e

其中e是落在A的左零空间里

p是落在A的列空间里

所以Ax^等于p一定有一解

我们就可以找到这个x^

而且在这种情况下

x^和p是一一对应的

我们也可以从下面来看

如果我们有两个x^ Ax^等于P

我们也可以从下面来看 如果有两个x^

Ax^_1等于p

Ax^_2等于p

那么Ax^1减掉Ax^_2就等于0

也就是x^1减掉x^2

是长在A的零空间里

而此时A的零空间是只有零向量

所以这两个最小二乘近似解

一定是相等的

对应到我们有唯一的最小二乘解

那么如果系数矩阵

A是列相关的

也就是A的秩是小于n的

那么A^TA的秩呢

等于A的秩是小于n的

我们正规的方程解不唯一

也就是说最小二乘解不唯一

我们注意到由刚才定义的伪逆

我们可以给出来一个

特别的最小二乘解

我们说x^+等于(A^+)b

它是一个最小二乘解

也就是说它满足正规方程

我们来验证一下这件事情

A^Tb减掉A^TAx^+

把A^T给拿出来

括号里面是b减掉Ax^+

那么把x^+的定义代进去

它是A^+乘以b

那么A和A^+结合在一起

由A的伪逆的性质我们知道

A乘以A^+是R^m到A的

列空间的正交投影矩阵

因此呢 这部分就跑到

A的列空间里去

那b是任意的一个m维的向量

我们知道R^m可以写成

A的列空间C(A)

和A的左零空间

N(A^T)的正交直和

b减少b在C(A)里的正交投影

它就落在A的左零空间里

那么这部分在A的左零空间里

因此它被A^T去乘以

就等于零向量

那么x^+满足正规方程

所以它是一个最小二乘解

那么这样定义出来的最小二乘解

有什么优点呢

我们发现在所有的最小二乘解中

我们用伪逆定义出来的

这个最小二乘解

它的长度来得最小

在这种意义下

我们称它是最佳最小二乘解

我们来看一下这件事情

我们假设还有一个最小二乘解

我们仍然叫x^

那么这两个最小二乘解

都满足正规方程

那我们两个式子相减

就得到A^TA去乘以x^减去x^+

等于0

也就是x^减掉x^+

落在A^TA的零空间里

我们刚才已经说了

A^TAx=0与Ax=0

是两个同解的线性方程组

所以它们的零空间是相等的

那也就是x^减掉x^+

落在A的零空间里

而另一方面呢

x^+是等于(A^+)b

我们之前定义A^+的时候

我们注意到它是把m维的向量

打到A的行空间里

所以这个(A^+)b

是落在A的行空间里

一方面x^+落在A的行空间里

另一方面x^减掉x^+

是落在零空间里

那么这两个向量是互相正交的

那我们来计算一下

这个最小二乘解x^的长度平方

我们说x^它可以写成

x^减掉x^+加上x^+

一方面这个向量落在N(A)里

这个向量落在C(A^T)里头

它们俩互相正交

由勾股定理

那么等于这两个向量长度平方和

又等于x^减掉x^+的长度平方

加上x^+的长度平方

那么这个向量它的长度

是大于等于零的

所以呢

这两个向量的长度平方和

是大于等于x^+的长度平方和的

那么我们就得到说

任意一个最小二乘解的长度

要大于等于我们由伪逆得到的

这个最小二乘解的长度

也就是说x^+它的长度是最小的

它是一个在这种意义下的

最佳最小二乘解

我们从下面的图上来看一下

刚才的情形

说此时矩阵A的秩小于n

而n可以写成A的行空间

和A的零空间的正交直和

R^m可以写成A的列空间

和A的左零空间的正交直和

给一个b向量

它不落在C(A)里头

所以Ax等于b没有解

那b由正交之和分解

b等于p+e

p是落在a的列空间里

那么我们有A^+

把p打回到A的行空间里

那么这个x^+就是

最佳最小二乘解

我们注意到说

(A^+) p等于x^+

那另外呢若(A^+)e是等于0的

(A^+) b是等于(A^+)(p+e)

(A^+)p + (A^+)e

(A^+)e跑到零点

(A^+)p跑到x^+ 这就是x^+

那么这就是我们最初定义的x^+

等于(A^+)b

这个最佳最小二乘解

在这节我们讨论了矩阵的伪逆

和线性方程组Ax=b的最小二乘解

在这个过程中

我们可以看到

实际问题的提出促进理论的发展

而理论的发展又反过来

促进实际问题的解决

二者交织在一起 共同前进

这节课就到这里

线性代数(2)课程列表:

第一讲:正定矩阵

-1.1 实对称矩阵A正定的充要条件

--1.1 实对称矩阵A正定的充要条件

-1.2 典型例题

--1.2 典型例题

-1.3 半正定矩阵及其判别条件

--1.3 半正定矩阵及其判别条件

-1.4 二次型

--1.4 二次型

-1.5* 有心二次曲线(central conic)

--1.5* 有心二次曲线(central conic)

-1.6* 三维空间中的二次曲面-6类基本的二次曲面

--1.6* 三维空间中的二次曲面-6类基本的二次曲面

-1.7 二次型的分类

--1.7 二次型的分类

-1.8 矩阵的合同

--1.8 矩阵的合同

-1.9* 惯性定理的证明

--1.9* 惯性定理的证明

-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号

--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号

-1.11* 正(负)定矩阵在函数极值问题中的应用

--1.11* 正(负)定矩阵在函数极值问题中的应用

-第一讲讲义

-第一讲:正定矩阵--课后习题

第二讲:相似矩阵

-2.1 引言

--2.1 引言

-2.2 相似矩阵的性质

--2.2 相似矩阵的性质

-2.3 Jordan标准形

--2.3 Jordan标准形

-2.4 定理的证明

--2.4 定理的证明

-2.5 Jordan标准形的应用

--2.5 Jordan标准形的应用

-第二讲讲义

-第二讲:相似矩阵--课后习题

第三讲:奇异值分解

-3.1 引言

--3.1 引言

-3.2 奇异值分解(Singular Value Decomposition)

--3.2 奇异值分解(Singular Value Decomposition)

-3.3 例题

--3.3 例题

-3.4 奇异值分解的应用

--3.4 奇异值分解的应用

-第三讲讲义

-第三讲:奇异值分解--课后习题

第四讲:线性变换 I

-4.1 线性变换的定义和性质

--4.1 线性变换的定义和性质

-4.2 线性变换的运算

--4.2 线性变换的运算

-4.3 线性变换的矩阵表示

--4.3 线性变换的矩阵表示

-4.4 线性变换与矩阵之间的关系

--4.4 线性变换与矩阵之间的关系

-第四讲讲义

-第四讲:线性变换 I--课后习题

第五讲:线性变换 II

-5.1 恒同变换与基变换

--5.1 恒同变换与基变换

-5.2 图像压缩——基变换的应用

--5.2 图像压缩——基变换的应用

-5.3 线性变换在不同基下的矩阵

--5.3 线性变换在不同基下的矩阵

-5.4 矩阵分解与基变换

--5.4 矩阵分解与基变换

-5.5 线性变换的核与像

--5.5 线性变换的核与像

-5.6 不变子空间

--5.6 不变子空间

-5.7* 幂零变换

--5.7* 幂零变换

-5.8* Jordan标准形

--5.8* Jordan标准形

-第五讲讲义

-第五讲:线性变换 II--课后习题

第六讲:伪逆

-6.1 伪逆

--6.1 伪逆

-6.2 Moore – Penrose 伪逆

--6.2 Moore – Penrose 伪逆

-6.3 最小二乘法

--6.3 最小二乘法

-第六讲讲义

-第六讲:伪逆--课后习题

第七讲:工程中的矩阵

-7.1 简介

--7.1 简介

-7.2 弹簧模型

--7.2 弹簧模型

-7.3 变量的线性关系

--7.3 变量的线性关系

-7.4 刚度矩阵

--7.4 刚度矩阵

-7.5 从离散到连续

--7.5 从离散到连续

-第七讲讲义

-第七讲:工程中的矩阵--课后习题

第八讲:图与网络

-8.1 简介

--8.1 简介

-8.2 图和矩阵

--8.2 图和矩阵

-8.3 网络和加权Laplacian矩阵

--8.3 网络和加权Laplacian矩阵

-8.4 关联矩阵的四个基本子空间

--8.4 关联矩阵的四个基本子空间

-8.5 注记

--8.5 注记

-第八讲讲义

-第八讲:图与网络--课后习题

第九讲:Markov矩阵和正矩阵

-9.1 问题引入

--9.1 问题引入

-9.2 Markov矩阵

--9.2 Markov矩阵

-9.3 正Markov矩阵

--9.3 正Markov矩阵

-9.4 正矩阵

--9.4 正矩阵(第一部分)

--9.4 正矩阵(第二部分)

-第九讲讲义

-第九讲:Markov矩阵和正矩阵--课后习题

第十讲:Fourier级数

-10.1 引言

--10.1 引言

-10.2 内积空间

--10.2 内积空间

-10.3 傅里叶级数

--10.3 傅里叶级数

-10.4 投影

--10.4 投影

-10.5 关于Fourier变换的注记

--10.5 关于Fourier变换的注记

-第十讲讲义

-第十讲:Fourier级数--课后习题

第十一讲:计算机图像

-11.1 引言

--11.1 引言

-11.2 平移

--11.2 平移

-11.3 伸缩

--11.3 伸缩

-11.4 旋转

--11.4 旋转

-11.5 投影和反射

--11.5 投影和反射

-第十一讲讲义

-第十一讲:计算机图像--课后习题

第十二讲:复数与复矩阵

-12.1 引言

--12.1 引言

-12.2 复矩阵

--12.2 复矩阵

-12.3 复正规阵

--12.3 复正规阵

-12.4 离散Fourier变换

--12.4 离散Fourier变换

-12.5 快速Fourier变换

--12.5 快速Fourier变换

-第十二讲讲义

-第十二讲:复数与复矩阵--课后习题

结课寄语

-结课寄语

--结课寄语

6.3 最小二乘法笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。