当前课程知识点:数学建模 > 第2章 数据处理方法 > 2.2 拟合函数的扩展 > 2.2 拟合函数的扩展
好的同学们大家好
我们刚才实际上在用数据处理的方法
用最小二乘方法讲了一个小例子
主要的来解决一下
我们国家从49年到94年总人口的问题
我们来预测了一下
我们的99年也是后面的一些此前的一些国家的人口问题
我们其中用到了两个函数
一个拟合函数是线性函数
一个拟合函数是一个指数函数
那么我们说对于我们现实生活里面来说的话
我们做这种拟合函数可能有多种多样的
我们做这种拟合函数可能有多种多样的
也就换句话说
我们可能会利用不同的函数来针对同样一组数据来进行拟合
当然呢最后我们一定会选一个对吧
函数表达式比较简单的
甚至我们说还要他的相对来说
误差要尽量小的这么一个函数
来作为我们最后来反映变量之间的一种规律的事情
所以我们接下来对拟合函数来做些扩展
同时我们的回答我们刚开始提到的那个问题平均值
他的计算的时候要根据是什么
首先
这个拟合函数y 等于 a 加 b x
我们简单的回顾一下
那么在这边x跟y呢
我们讲呢
是一个观测的数据点
ab的是一个参数 那么对xi yi
我们说利用误差的平方和 也就是我们通常说的yi减a减bxi
误差的平方和端到最小
那么对他关于a关于b求偏导
让他等于零
我们可以得到ab
这是我们刚才已经说过的事情
我们把这个线性函数呢我们跟他特殊化
首先特殊成y等于b
y等于b是什么意思呢
也就拿我们的考试来说
每个孩子他的考试成绩
我们说他本身有一个固有的分数
那么针对每次考试呢
我们可能会在这固有的分数上下来回波动
对于我们老师对于家长来说
可能比它的固有的分数高
我们就认为它考得好或者说超常发挥
或者说比它低的话
我们认为什么
没有发挥出水平出来
那我们说这个水平到底是多少呢
也就是我们说
这个b它是个客观的存在一个值
每次呢
观测值都是在它上面上下进行摆动
也就是yi等于b加上一个误差εi
怎么能估算那个b呢
于是呢 我们就开始利用我们的办法
误差的平方和达到最小
那误差的平方和达到最小的话
也就说求解我们的yi减去b括号的平方
那么达到最小
问b取多少取多大的值时候能够达到最小
那么yi减去b括号的平方
那么实际上就是我们说的一个一元二次函数了
那么一元函数能够达到最小的话
那按照我们的初中的知识
我们就可以知道了什么时候达到最小呢
那就是x等于负2a分之b达到最小
那把它带到这里面来
那就是我的b等于n分之∑yi
那么这个时候能整个Q呢 就达到最小
那么∑yi/n是谁呢
就是我们刚才一直提到的平均值
这也就换句话说
我们用最小二乘方法
来求解了 或者说来说清楚了我们的平均值的
数学根据在哪个地方 就是使得它的误差平方和达到最小
那么这个时候得到了一个平均之值的一个结论
好的 接下来我们对这个函数呢
再进行进一步的拓展y等于bx
所以y等于bx 指的什么意思呢
也就是Y跟X之间是个比例函数
那么一样道理来说
我们要观测的数据点呢
跟我们的理想的数据点之间它会有偏差
因此可以表述为
yi等于bxi加εi
好的 这是我们最小二乘的想法
应该是计算什么呢
应该是计算它的误差的平方和达到最小
也就换句话说
就是我们的yi减去bxi括号的平方达到最小
那么对它来说的话
一样的我们可以把它写成我们的关于B的
一元二次函数或者说
用微积分的办法就是关于Q 关于B的求导 让导数等于零
从而得到我们说的B的估算值
那就等于∑xi^2
分之是xi乘上yi求和了
这是我们说的两种特殊的情况
对于这个线性函数
我们就不再多说它了
接下来我们把这个函数呢
一元函数我们呢进行推广
推广成y等于 b1x1加上b2x2
也就换句话说 把我们的一元的线性函数
我们开始往二元的线性函数进行推广
y等于 b1x1加上b2x2
那么怎么来估算我们的B1B2呢
我们说应该是借助我们的最小二乘的想法
最小二乘的想法
我们认为我们认为数据点的y等于 b1x1加上b2x2
我们还会有个偏差
那我们当然是因为这个偏差的平方和达到最小构成那个Q值
然后呢
问B1B2且多少的时候使得这整个偏差Q能够达到最小
取多少呢 很自然的话就是说把我们的Q呢
关于B1求偏导
把我们的Q呢 关于B2求偏导
那么让它分别为零
这样就得到了我们说的关于B1B2的一个二元一次的线性方程组
那么利用这个线性方程组大家就可以
自然的可以计算出我们的B1跟B2出来了
大家可以计算出我们的B1跟B2出来了
这是我们说的二元的线性函数
把这二元线性函数呢
我们在往下推广一下
就说我们加上一个常数项了
也就是我们的y等于 a 加上b1x1加上b2x2一样道理
我们的数据存在一定偏差
也就是我们的观测值跟理论值之间
有个偏差
有个εi
那么根据最小二次的想法
我们依然是让这个偏差的平方和达到最小
于是就得到了我们说的
yi减去a减去b1的x1i减去b2的x2i那么括号的平方
那么得到我们的总的偏差
然后计算总的偏差最小的时候B1B2以及A
应该是什么样的值
因此计算我们的Q呢
关于A求偏导
关于B1求偏导
关于B2求偏导
然后让这个三个偏导分别为零
就得到我们说的一个三元一次的线性方程组
从而把这个A B1跟B2呢
可以给它计算出来
可以计算出来
这是我们说的
线性函数的事情
把这线性函数呢
我们进一步推广
进一步推广
那就是我说的一些非线性函数我们怎么办
我们说
理论上来说
非线性的函数
要采取它的求最小二乘
或者说求它的参数
估计那应该用非线性最小二乘来说
但是有时候我们为了偷懒
为了简化过程
我们就开始把一些非线性的函数
把它转化为我们的线性函数来进行处理
然后借助于我们的线性最小二乘的想法来估算它相应的参数
第一个问题呢
我们看这么一个表达式
y等于a加b1乘上f1x b2乘上 f2x一直到bn乘上 fnx
那么很显然的话
如果f1 f2 fnx都不是一个X的一次函数
那么很自然的话
整个Y跟X之间的它将会构成的非线性函数
那么对这个非线性函数说怎么办呢
我们要求A B1一直到Bn这些参数
所以我们接下来引入一个数学的变换
也就是说让ui等于 fix
ui等于 fix
那么这一来的话 我们就可以把转化到我们
刚才的那个多元的线性函数里面去
也就是y等于a加b1u1 b2u2一直到bnun
这样一来的话
利用我们刚才的多元线性函数
我们可以把参数A跟Bi可以跟它估算出来了
第二个就是我们刚才已经洞察了事情了
所以呢
我们说的一个指数函数
y等于a乘上e的^bx
虽然我们说的y跟x 它是个指数函数
是个非线性函数
但是如果我们跟它通过一个数学的变换
通过一个数学变换两边取上一个对数的话
那么将会得到一个lny等于 ln a +加上b x
也就是lny跟x之间
它将是个线性函数
于是呢
我们可以利用我们的线性的处理办法
可以把lna 把B求出来
从而反过来把A跟B可以计算得到
这是我们说的比较简单的一些非线性函数
我们把它转化为线性函数来处理
那么第三个函数是谁呢
第三个函数就是我们通常说的幂函数
y =等于a乘上x b次方
对于幂函数来说
大家都可以清楚
那么它也是个非线性函数
那怎么办呢
我们说y跟x它不是线性的
但是一样道理
我可以通过一种变换两边取对数以后
那么ln x跟ln y之间 它将会构成一个线性的
两边求完对数以后就会得到
ln y 等于 lna加上b 乘上ln x
这样就表示ln x跟ln y之间构成一个线性的
既然它们之间是线性的一样的关于我们的斜率
关于我们的截距就可以跟它估算出来了
那么估算出来以后
很自然的话我就可以反解出我们说的
反解出A跟B这两个参数
最后呢 我们在讨论两种比较特殊的非线性函数
一种的是y 等于 a加加bx分之一
一种的是y 等于 a加加bx分之一
那么从这函数本身可以看得出来
那么y跟x它不是线性的
但是呢
我们作为一个变换变成1/y
我们将会发现它就会等于一个a 加 bx
所以我们发现1/y跟x它们将会构成一个线性的
那么很自然的话
这边是线性的
那么AB这两个参数就可以估算出来了
那么最后一个y = x/(b+ax)
那么对于它来说的话一样道理
我们说y跟x之间它不是线性的
但是我们发现
那么这么一来的话很自然
就用刚才的办法
我们可以把A可以把B这两个参数可以估算出来
所以呢
这是我们的最小二乘的想法
我们可以处理先线性的
参数估计也可以处理一些比较简单的非线性函数的一些参数估计
也就是说想办法把这些非线性函数
跟它转化为我们的线性函数来进行参数估计
这是我们说的最小二乘法的一个思想
那么接下来我们利用参数估计这种办法我们先看一个例子
那么这个例子说明什么东西呢
这个例子
我们说的是一个一个体育比赛的
一个运动员的成绩的预测的关系
那么这里面列举了我们一百米两百米
四百米
八百米
一千米
以及一千五百米
那么
对于顶级运动员来说
他的世界纪录能分别是9.95 19.72
一直到我们的212.1 这么一个时间
那我们现在呢
想利用这些数据我们来分析一下运动员的成绩
跟我们跑步的距离之间的一种关系
跟我们跑步的距离之间的一种关系
那么借助于我们的数据处理的办法
我们首先也是建立一个我们说成绩时间跟距离之间的一个散点图
把这个散点图
我们拿过来看的话
看看它的趋势也是
近似在一条直线还是有一些别的函数来拟合它
那么首先呢 我们可以看出来这个趋势有点近似在一条直线上
竟然是近似在一条直线上的话
那么很自然就可以考虑我们线性函数的拟合了
那么t = a + b x
那么t = a + b x
那么把这种六组数据带进来以后很自然的话
我们可以把参数A可以把参数B呢
可以给它拟合出来
把参数A可以把参数B给它拟合出来
那我得到一个什么
t 等于负的 -9.99 加上 0.145 x
那么对这个线性模型
我们刚才说过了在我们国家的人口在线性模型里面
我们说是比较有意义的
能够体现出我们的国家的人口数量跟时间的关系
但是对于我们这个模型来看我们的线性模型有没有作用
有没有意义呢
我们很自然的话
我们就开始拿实际的数据来进行分析进行检测
那么从这里面可以看得出来
如果x要不小于68.89的值
也就是说
小于快70米的时候
我们会发现这个数计算出它t < 0
也就我们换句话说不用花时间还是要负的时间
我就可以跑差不多快70m
那我想这个结果就有点说不过去了
有点不符合我们的现实了
甚至当x只等于一百米的时候
跑步的时间总共才4.51秒
所以我们发现这个时候发现我们的线性模型用来预测
我们的时间跟距离之间将会出现一个很大的一个偏差了
于是呢
我们就开始考虑一些别的模型
来解拟合了
那么考虑什么的模型呢
我们考虑了一个幂函数
t = a x^b
t = a x^b
我们刚才说过了
虽然t跟x之间它不是线性函数
但是我们可以通过一个对数变换
可以发现我们说的ln x 跟ln t 之间
它将是个线性
它将是个线性
既然它是线性的
那么很自然的话
在ln x 跟ln t 之间
我们可以把相应的我们的斜率相等间距可以给它求出来
然后跟它反过来求出我们原始参数的A
对它进行指数函数
因此我们可以得到时间T呢
等于0.48 x^1.145
好的 接下来的话
我们把这组数据我们带出来
得到我们这么一个表格
我们可以看出来
当x=100的时候的话
我们利用我们
我们的幂函数模型我们可以得到
大概是跑出了9.39
那到两百米的话
大概跑出了20.78
如果是一千五百米的话
我们大概是跑出了208.9s
那么这么一来的话
跟我们的实际的数据进行分析
进行比较的话
我们发现这个时候的数据还是比较真实的
还是比较可用的
也就换句话说
我们对于这个时候的误差
我们会得到一个23.55的这么一个误差
相比我们的线性模型来说
那么我们的幂函数模型就是一个可行的一种方案
也就换句话说
我们可以用幂函数来解释距离跟时间之间的关系
那么从这个例子
我们也可以看得出来
对一个同样一个实际问题
我们可以用多个不同的数学表达式
或者说数学模型来进行表述进行刻画
从中再来找出一个总的误差比较小的
我们解释起来比较简单
比较方便的这么个模型来对它进行刻画
这是我说的这么个结论
好的 只要我们在给出一个想法
除了拟合模型还是经典模型
我们说都是一种多种因素
综合作用在我们的因果关系上的一个结论
因此呢
我们一般来说就需要什么东西
更多的需要从机理跟机制方面来做一些分析
做些研究
并要求需要从一些实际的结果里面来进行检验它
并要求需要从一些实际的结果里面来进行检验它
虽然我们认为数据能够反映我们的一些信息
但是我们更多的是希望借助于数据所反映出来的信息
能够对机理对机制做一些探讨做些研究
这是我们的第一个想法
第二个想法所谓的最小二乘是干什么事情呢
所谓的最小二乘
虽然就是我们说的要求解y=a+bx
本来两个点就可以确定的a b
结果你现在来了N个点来进行求解
也就换句话说
就是我们通常说的两个参数
两个方程
就可以现在能给出了N个方程来进行求解
那实际上最小二乘做的就是我们说的这么一件事情
也就是说求解证明一个N个方程
一个表达式的一个近似的求解的办法
第三个
我们在
最小二乘里面我们提到一个拟合函数的事情
如果是a+bx的话
或者我们可以把它称之为是一种回归分析
但是我们可以清楚我们在不同的实际问题当中
那么函数的反应到底是什么样的
有的在这一段里面可能是一个函数的反应
另外一段可能又是一个函数的反应
那么中间的我们说就会有一个节点
过了这个节点可能是一种反应
过了另外一个节点就是另外一种反应
这就是我们通常说的可能是用两个分段的函数来表示
我们是它的总体的反应
那么接下来问题就出来了
那么节点分段点在哪个地方
这是我们在实际问题当中需要去进一步探讨的一个问题
因此他也会构成了我们的新的一个分支
我们把它称之为变点的回归分析
好的 关于我们的最小二乘方法
带着拟合函数的拓展
我想今天就说到这个
下课 谢谢大家
-1.1 案例分析
-1.2 数学建模绪论
-1.3 数学建模活动
-第1章 习题
--第1章 习题
-2.1 最小二乘方法
-2.2 拟合函数的扩展
-2.3 最小二乘方法应用
-2.4 线性插值
--2.4 线性插值
-2.5 样条插值
--2.5 样条插值
-第2章 习题
--第2章 习题
-3.1 Malthus模型
-3.2 Logistic模型
-3.3 捕食者模型
-3.4 差分方程模型
-3.5 随机动态模型
-第3章 习题
--第3章 习题
-4.1 成对比较矩阵
-4.2 一致性指标
-4.3 权重向量的计算
-4.4 量纲分析
--4.4 量纲分析
-4.5 轮廓模型
--4.5 轮廓模型
-第4章 习题
--第4章 习题
-5.1 名额分配
--5.1 名额分配
-5.2 Hamilton方法
-5.3 Q方法
--5.3 Q方法
-第5章 习题
--第5章 习题
-6.1 两变量的线性规划
-6.2 单纯形方法
-6.3 整数规划
--6.3 整数规划
-第6章 习题
--第6章 习题
-7.1 模糊集合
-7.2 模糊关系
--7.2 模糊关系
-7.3 模糊综合决策
-7.4 模糊聚类分析
-第7章 习题
--第7章 习题