当前课程知识点:简明线性代数 > 第7章 矩阵的特征值理论 > 7-1 矩阵的特征值与特征向量 > 7-1 特征值与特征向量
同学们 大家好
欢迎来到mooc课程
线性代数先修课
第七章 矩阵的特征值理论
7.1节 矩阵的特征值与特征向量
在本讲中
我们将从一个实际的问题入手
引入方阵的特征值
和特征向量的概念
并介绍特征值与特征向量的
几个基本问题
其中我们将重点讨论
特征值与特征向量的计算问题
给出它们的求解步骤
本章的开始
我们先来看
一个实际的应用问题
例1 人口流动问题
假设某城市的总人口固定不变
我们把它记为c
开始时市区人口数为x0
郊区人口数为y0
于是x0+y0=c
如果今后
每年都有5%的
市区居民搬到郊区
而有15%的
郊区居民搬到市区
那么我们的问题就是
就是20年以后
该是市区和郊区的
人口各为多少
第二个问题
请对该市长期的
人口分布做出预测
下面我们就来
分析下这个问题
首先我们
要找出第n年和第n+1年
市区和郊区人口的关系
然后根据递推关系得到
第20年和开始时也就是第0年的
人口数的关系
进而
我们对充分大的n
根据第n年与第0的
人口数的关系
预测长期的人口分布规律
下面我们就来
具体求解这个问题
设第n年市区人口数与郊区人口数
分别为xn和yn
则根据题意
xn+1 yn+1与xn yn
就有如下的一个关系式
也就是xn+1=0.95xn+0.15yn
它们表示第n+1年的市区人口
它等于第n年市区人口的95%
再加上第n年郊区人口的15%
那么同样的道理
yn+1=0.05xn+0.85yn
那么我们把这个式子
表为矩阵的形式
就有这样的形式
其中我们
把黄色方框里的记为A
于是整个就可以表为
xn+1 yn+1这个二维列向量
等于A乘以xn yn这个二维列向量
于是反复地利用上述关系
我们就可以得到如下的递推关系式
也就是xn yn等于A的n次方
再乘以x0 y0
从而我们也就得到了
第n年的人口数和刚开始时
也就是第0年人口数之间的关系
于是这个问题的求解关键
就是如何去
计算一个矩阵的n次方
然而
手动计算A的高次方
并不是一件容易的事情
比如说
这道题里面
我们需要计算A的20次方
于是借助计算机
我们可以得到
这样的一个近似的结果
进一步做近似
我们就发现
A的20次方约等于这样的
一个由4个分数组成的矩阵
因此
利用刚才那个递推式
我们就可以得到
x20和y20构成的二维列向量
就等于A的20次方
乘以x0和y0这个列向量
计算结果是这样
再利用x0+y0=c
我们就得到了这样的结果
也就是说20年之后
市区人口约等于
刚开始总人数的3/4
而郊区人口约等于
刚开始总人口的1/4
借助计算机
我们对更大的n进行数值计算
可以得到
xn和yn在n充分大的时候
也趋近于3/4c和1/4c
下面我们提出一个问题
也就是是否有方法
可以让我们不需要依赖计算机
也可以计算A的n次方
并对长期的人口分布进行预测
我们的回答是肯定的
但是需要大家
先来学习本章即将介绍的内容
为了解决上述问题
我们将引入
特征值与特征向量的概念
定义1 设A为n阶方阵
若存在数
λ以及n维非零的列向量X
使得AX=λX
我们把这个式子记为式1
也就是说如果
有A、X和λ满足式1的话
我们则称λ是A的特征值
而X是A的属于
特征值λ的特征向量
对于定义1
我们做以下3点的强调
第一点强调就是
该定义只是用与方阵的情形
第二点强调就
是特征向量一定要求是非零向量
第三点强调就是
特征向量是有附属性的
说到特征向量
一定要指明
它是哪个特征值的特征向量
为了增加大家的感性认识
我们先来看两个最简单的例子
对于零方阵大O
我们很容易知道
0即为其特征值
而所有非0的列向量
都是属于特征值0的特征向量
而对于n阶单位阵In
很容易通过1式来验证
1为其特征值
而所有非零列向量都是
属于特征值1的特征向量
进一步我们对定义1
还有如下两点说明
第一 特征值与特征向量
是成对绑定出现
也就是说有特征值
一定就有特征向量
反之亦然
但是它们俩之间
有从属关系
也就是我们刚才
强调的第三点
特征向量是属于
某一个特征值的
第二点说明是特征向量
必须要非零
但是特征值可以为0
比如说刚才
零方阵的例子就是这样子的
特征值与特征向量的定义
并不是凭空想象出来的
而是具有具体的
几何意义与实际意义
例如当今网络搜索中
如果大家输入电脑和计算机
这两个词
搜出的相关结果
几乎是相同的
如果究其原因
其实是后台算法
将这两个词出现的语境列为
两个很大的矩阵
进而计算
这两个矩阵的特征值
发现它们的特征值几乎相同
故认为它们表示同样的含义
从而列出
几乎相同的搜索结果
而这说明了特征值反映了
一些事物的本质特征。
在几何方面
特征向量对应了
映射作用下某种不变量
也就是所谓的不变子空间
而特征值对应了
这个不变集合上的
共同特征量
而这一点我们将在
第八章当中详细讨论
另外特征值与特征向量的问题
还可以引出
矩阵对角化的问题
从而给出计算
A的k次方的理论方法
此外
在数学的其他分支
以及其他学科当中
比如说
微分方程数值解
矩阵函数
物体与波形的固有频率等等
在很多实际问题中
特征值与特征向量
都有非常重要的应用。
下面我们来看
特征值与特征向量
的几个基本问题
对于给定的n阶方阵A
我们有如下的
问题有待讨论
第一个问题即存在问题
也就是A是否存在
特征值与特征向量
第二个问题个数问题
也就是A若存在
特征值有多少个
对于A的一个特征值
属于它的特征向量共有多少个
第三个问题计算问题
也就是能否给出方法计算出
A所有的特征值与特征向量
第四个问题关系问题
也就是A的
各个特征值之间有何关系
属于A的不同特征值的
特征向量有何关系
第五个问题结构问题
也即属于
A的同一个特征值
的特征向量
组成的集合结构如何
下面我们就重点讨论
特征值与特征向量
的计算问题
首先我们
来试算一个简单的例子
例2 设A等于这样的一个二阶方阵
请求它所有的
特征值和特征向量
首先我们
假设λ是A的一个特征值
而属于λ的一个特征向量
我们把它设为X
于是根据定义
它们应该满足AX=λX的形式
我们带入以后
就有这样的一个结果
进一步我们把它表示为
线性方程组的形式
就可以把它表示成为
关于x1与x2的
含参的齐次线性方程组
而且参数就是λ
这是一个两个未知数两个方程的
齐次线性方程组
按定义x1 x2构成的
向量就是特征向量
那么特征向量是非零向量
于是要求上述
齐次线性方程组有非零解
而这就等价于
它的系数矩阵的行列式要等于0
也就是我们
把这个行列式展开以后
就等于λ-2乘以λ-3
要等于0
于是我们就可以知道
只有两个数可能会
让这个式子等于0
也即λ1=2和λ2=3
而这两个数就是
A的两个特征值
下面我们分别来
求解属于
特征值2与特征值3的特征向量
对于第一个特征值λ1=2
我们将其带入到
齐次线性方程组当中
就可以得到这样的
一个线性方程组
求解这个方程组
就可以得到属于2的
特征向量就是等于
这样的形式
当然其中由于
特征向量是不等于0的
因此我们
这里要求系数k
是任意的非零常数
而对于特征值3
我们将其带入到
齐次线性方程组之后
就得到这样的一个方程组
求解这个方程组
就可以得到属于
特征值3的特征向量
是这样的一些向量
其中我们同样
要求k是非零的常数
在本例当中
我们发现些规律
但是对于一般的矩阵
是不是也有
类似的方法和规律呢
下面我们就来
展开一般的讨论
假设我们
给定一个n阶方阵A
它的分量用小aij表示
设A的特征值λ与特征向量
X是存在的
则有如下的1式成立
对于1式
我们把右边移到左边
并合并之后
就可以得到一个等价的式子
也就是这样形式的
矩阵和向量乘积的一个等式
在把它展开以后
实际上就得到了
形如式2的这样的
一个齐次线性方程组
这个线性方程组
有n个未知数n个方程
其中λ是一个参数
由特征向量X是存在的
那么我们就知道
齐次线性方程组2
就一定有非零解
而这又等价于
2的系数矩阵的行列式要等于0
也就是λI-A的行列式要等于0
我们可以把这个行列式
写成具体的n乘n的形式
就是这样
我们把这个式子称为第3式
刚才的推导说明
A的所有特征值
一定要满足3式
反过来
如果满足3式的一个数λ
也一定是A的特征值
那么求属于这个特征值的
所有特征向量
只需将λ代数2式
求出齐次线性方程组的
所有非零解即可
特别地
对于上述3式
左边的含参的行列式
我们有如下的定义
也就是定义2
其中我们把这个n阶行列式
展开以后很容易发现
它是一个关于λ的n次多项式
于是我们把这个多项式称为
矩阵A的特征多项式
于是求
求给定矩阵A的特征值
就相当于
求A的特征多项式的根
故此
特征值在有的时候
也叫做特征根
其中一个特征值λ
作为特征多项式的根的重数
我们就把这个重数称为
特征值λ的代数重数
根据以上讨论
我们可以把对于给定方阵A的
特征值与特征向量的
计算步骤整理如下
第一步
计算A的特征多项式
具体操作就是进行
一个含参的行列式计算
第二步
求出特征多项式的所有根
把它记为λi
它们就是A的全部特征值
这步具体计算涉及到因式分解
或者一元高次方程的求根
第三步
分别把每个特征值λi
代入到齐次线性方程组λI-A
再乘以X等于0
求出它的基础解系
并确定它的解空间
其中解空间当中所有的非零向量
就是A的属于λ的全部特征向量
这一步涉及到的具体计算就是
我们熟悉的齐次线性方程组的求解
经过上述的步骤
我们再来讨论
特征值与特征向量的存在问题
由于特征多项式
是关于λ的一个n次多项式
我们知道
它在复数范围内总是有根的
所以在复数范围内
A的特征值总是存在的
于是特征向量也总是存在
关于个数问题
由于特征多项式
在复数范围内
在累计重数的意义下共有n个根
所以在累计重数的意义下
方阵A也共有n个特征值
而我们知道特征向量X
是齐次线性方程组的非零解
有非零解则必有无穷多解
故属于A的同一个特征值的
特征向量有无穷多个
实际上我们也很容易验证
如果X是一个特征向量的话
那么X的非零倍数也就是kX
也同样满足
特征值与特征向量的定义式
从而k倍的X也是特征向量
我们需要说明的是
在本门课程当中
我们只考虑实矩阵A
由于特征向量X是对应的
齐次线性方程组的一个非零解
于是当特征值λ为实数时
对应齐次线性方程组
所解出的特征向量也必为实向量
而另一方面
由定义式我们可以知道
当特征值λ为复数时
对应的特征向量必为复数
那么这种情况超出了
我们本课程的讨论范围
因此我们把问题就集中到
求出A的所有实特征值以
及属于它们的所有实特征向量
下面
我们再来看一个特殊的例子
也就是例3
请大家考虑
这样的一个对角矩阵
其中a1 a2
到an是对角线上的n个元素
我们要求它们
为互不相同的实数
我们要求
求A的特征值与特征向量
于是根据刚才的步骤
我们第一步
先计算其特征多项式
由于这是一个对角矩阵
因此它的
特征多项式非常容易计算
就是这样的n项直接相乘
显然我们就可以
得到它的全部特征值
就是a1 a2
一直到an
也就是主对角线上的n个元素
第二步
对于每一个特征值
我们去计算它的特征向量
也就是把λ=ai代入到
这样的线性方程组
那么代进去之后
我们会发现它所对应的系数矩阵
就是这样的一个对角矩阵
其中我们要求
ai和aj是互不相同的
所以在上述系数矩阵当中
主对角线上只有一个位置是零元素
而其他位置是非零的
这等价于说它有n-1个主元素
从而有n-1个主变量
而自由变量只有一个
于是我们就可以解出
它的基础解系就是一个向量
我们把它记为Xi
而Xi正好就是第i个自然基
因此属于特征值λ=ai的特征向量
也就是第i个自然基的ki倍
其中ki是所有的非零实数
并且i对于1 2一直到n都成立
我们提出一个问题
也就是在本例当中
属于不同特征值的特征向量
显然是线性无关的
这是一个偶然现象吗
还是有更一般的规律
本讲小结
在本讲中
我们从一个具体的问题入手
即简单的人口流动问题
这个问题的求解关键
就是计算方阵的高次幂
为了解决这一问题
我们引入了
方阵的特征值与特征向量的概念
需要注意的是
特征值与特征向量是绑定在一起的
成对出现
但也有从属关系
即特征向量是属
于某一个特征值的
另外特别需要注意的是
特征向量一定是非零向量
接下来
我们提出了
特征值与特征向量
相关的几个基本问题
即存在问题 个数问题 计算问题
关系问题与结构问题
我们重点讨论了计算问题
其中特征值的计算即为
特征多项式的求根问题
而特征向量的计算即为
对应齐次线性方程组的求解问题
对于其他基本问题
我们将在之后的章节进一步讨论
本讲的内容就到这
下讲再见
-宣传片
--宣传片
-序论
--序论
-1-1 二元、三元一次方程组
-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法
-1-2 一般线性方程组的解法:Gauss消元法
-第1章 线性方程组--1-3 线性方程组解的判定
-1-3 线性方程组解的判定
-第1章 线性方程组--1-4 齐次线性方程组
-1-4 齐次线性方程组
-第2章 行列式--2-1 二阶、三阶行列式的性质
-2-1 二阶、三阶行列式的性质
-第2章 行列式--2-2 n元排列
-2-2 n元排列
--2-2 n元排列
-第2章 行列式--2-3 n阶行列式的定义
-2-3 n阶行列式的定义
-第2章 行列式--2-4 行列式的性质
-2-4 行列式的性质
-第2章 行列式--2-5 行列式的计算1-利用性质
-2-5 行列式的计算1-利用性质
--Video
-第2章 行列式--2-6 行列式的展开公式
-2-6 行列式的展开公式
-第2章 行列式--2-7 行列式的计算2-综合
-2-7 行列式的计算2-综合
-第2章 行列式--2-8 Cramer法则
-2-8 Cramer法则
-第3章 矩阵--3-1 矩阵及其线性运算
-3-1 矩阵及其线性运算
-第3章 矩阵--3-2 矩阵的乘法
-3-2 矩阵的乘法
-第3章 矩阵--3-3 矩阵的其他运算
-3-3 矩阵的其他运算
-第3章 矩阵--3-4 分块矩阵
-3-4 分块矩阵
--3-4 分块矩阵
-第3章 矩阵--3-5 初等矩阵
-3-5 初等矩阵
--3-5 初等矩阵
-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件
-3-6 逆矩阵及矩阵可逆条件
-第3章 矩阵--3-7 逆矩阵的求法
-3-7 逆矩阵的求法
-第4章 向量空间--4-1 n维向量空间
-4-1 n维向量空间
-第4章 向量空间--4-2 向量组的线性相关性
-4-2 向量组的线性相关性
-第4章 向量空间--4-3 线性相关性的更多理论
-4-3 线性相关性的更多理论
-第4章 向量空间--4-4 极大线性无关组
-4-4 极大线性无关组
-第4章 向量空间--4-5 向量组的秩
-4-5 向量组的秩
-第4章 向量空间--4-6 矩阵的秩
-4-6 矩阵的秩
--Video
-第4章 向量空间--4-7 矩阵秩的运算律与相关结论
-4-7 矩阵秩的运算律与相关结论
-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论
-5-1 齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论
-5-2 非齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-3 线性方程组的几何意义
-5-3 线性方程组的几何意义
-第5章 线性方程组的解理论--5-4 矩阵方程
-5-4 矩阵方程
-第6章 内积空间--6-1 向量空间中的内积与度量
-6-1 向量空间中的内积与度量
-第6章 内积空间--6-2 标准正交基与正交矩阵
-6-2 标准正交基与正交矩阵
-第6章 内积空间--6-3 Schmidt正交化与QR分解
-6-3 Schmidt正交化与QR分解
-第6章 内积空间--6-4 正交投影与正交分解
-6-4 正交投影与正交分解
-第6章 内积空间--6-5 最小二乘问题
-6-5 最小二乘问题
-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量
-7-1 矩阵的特征值与特征向量
-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间
-7-2 特征多项式与特征子空间
-第7章 矩阵的特征值理论--7-3 相似矩阵
-7-3 相似矩阵
--7-3 相似矩阵
-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题
-7-4 矩阵的对角化问题
-第7章 矩阵的特征值理论--7-5 实对称阵的对角化
-7-5 实对称阵的对角化
-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用
-7-6 特征值理论的几个应用
-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换
-8-1 矩阵映射与矩阵变换
-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换
-8-2 二维三维空间中几类特殊的矩阵变换
-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法
-8-3 矩阵映射的复合与矩阵乘法
-8-4 矩阵变换的不变量与特征值理论
-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似
-8-5 坐标系替换与矩阵相似
-第8章 矩阵与变换--8-6 正交变换
-8-6 正交变换
--8-6 正交变换