当前课程知识点:运筹学 >  6. 图与⽹络分析 >  6.7 指派问题 >  课程学习方法2

返回《运筹学》慕课在线视频课程列表

课程学习方法2在线视频

返回《运筹学》慕课在线视频列表

课程学习方法2课程教案、知识点、字幕

现在问题又来了

你要达到我们说的这个过程的话

你怎么样来做这件事呢

实际上

基本的方法我们就要选择一个

含有待定参数的一个函数

我们就管它叫f ^x

这个X是我们

对应的样本的自变量

那再加上一个θ

这个θ就是我们说的待定参数

通过调整这个待定参数θ

就可以使得

这个函数的形态发生一些变化

这个基本是可用的方法

因为你不能说在整个的这个

函数空间里去找

这个函数空间

你们学过数学分析的知道

有对无穷的度量阿列夫(ℵ)

这个大的就不可能的

你连在这个数轴去找都找不到

更何况这函数空间是ℵ

对应的是ℵ2的话

这么大的空间去找是不太可能的事情

但是

我有了一个对应的一个θ

参数去调整的时候

就会使得

对应的这个函数里面

会得到一个可以

达到我们预想效果的函数

这里我举一个例子

大家一定学过像这种

通过调整参数

来达到逼近程度

这个大家现在接触非常多了

比如说现在

这个能力很强的

深度神经网络

包括支持向量机等等

它都是通过调整参数

里面的用的一些

后面会看到的基函数的方式

来通过不同参数的调整 使函数形态

发生了一些变化

甚至更古老一点

大家可以知道

比如说傅里叶变换

咱们对应的傅里叶级数也是一样的情况

通过一系列的三角函数

通过前面它的对应的取值的变化

它们之间的求和之后

也会改变最后目标函数

对应的函数拟合的形态

甚至其实可以用三角函数

来拟合方波这样

对应的函数出来的

那么在这个过程中的时候

我们要极小化这种误差

对误差的度量也会有对应的要求

那么我们常用的就是这个

p范数的方式

这个p可以取任意的方式

常用的有几种

比如说1范数的时候

那么它所度量的就是

每一个样本里面

对应我预测的这个

和y值之间对应的这个绝对值的

这个对应的情况 然后

对所有的样本求和

这是p1范数

2范数大家更熟了

这个对应的就是这个平方

然后

它这个2范数跟我们

整个这个空间里面的距离的

(在直觉上)最接近的

当然还可以求无穷范数

也就在所有的误差里面

最大的那个误差

把它单独挑出来

这都可以作为一个

还有其它的分数范数都可以

这个都可以做选择的

就可以作为

我们说刚才说过的

在样本上误差的一个度量方式

那有了它之后

那么所有的刚才说过的

问题归属

就变成这样一个问题

最终要解决的

大家可以看到

这个θ就是我们对应的

咱们改变 具有待定参数的

这个函数f ^X这个参数里面

这个θ的取值

它实际上来说是没有任何约束的

就它怎么取都行

这个没有给它加上约束条件

然后通过改变普通的θ

就可以使得这个函数的形态

可以发生变化

使得在所有的样本上

跟我预报的y值之间的对应的

p范数的

这个衡量的误差达到最小化

可以看到这么一个过程

大家可以看到这个对应的公式

那么这个实际上本质来说是

求解什么一个问题

就是连续变量的一个

无约束的优化问题

大家可以看到这里面

没有其他的任何的约束条件

无约束

什么叫约束条件

我们后面在马上要进入到的

线性规划规划里面

也会给出严格的定义

现在大家可以广泛地

理解一下它这个含义

那么对应来说

由于对样本误差的

度量的方式不同 大家可以看到

这里会存在一些比较复杂的情况

比如说这里就有平方项了

那肯定会存在一些非线性的一些情况

在里面或者更一般的情况

好 这是第一种情况

我们看到这个

就是我们解决

一个实际问题里面

所带来的

数学上或者用这个数学公式

来表示的一个实实在在的

需要求解的一个规划问题

但是光做到这点是不够的

那么实际来说的话往往

比如说我举个例子

比如说我们用无穷范数

来描述这个优化问题

那么这个时候大家可以看到

也就是说 在N个样本里面

我要找到

就是这个采样里面的N个样本里面的

跟我这个对应的

这个y值就是这个

样本里面值

最大的那个值里面的

让它最小化

最大的那个都最小化了

这也是一个对应的这个范数

但是衡量这个值要保证

它一定是绝对值

这种这个无穷范数在去

做度量的时候

那么这个优化目标带来一个

比较大的问题

这个问题是什么

跟咱们

上一节里面的一般性方法

带来问题是一样的

就是这个目标函数式的求导是很麻烦的

那为什么求导麻烦

就引出一个 值得我们关注的问题

因为什么 因为这个刚才说过了

咱们求解问题的一般性思路是什么

是找方向

沿着方向去做

这个搜索找到一个步长

那么求导

如果不容易去求

那我们对这个问题来说

我就不太容易找到哪个方向

才是使得我们目标函数进一步改善

但是这个问题

居然很特殊

特殊到什么程度

它可以做为一个简化

不叫简化...一个转化

一定记住这个词“转化”

这个“转化”

就用到了

我们刚才说过的

如果你知道一些

对应运筹学的模型的知识的时候

这种转化变得很重要

你看 它和下面这个问题

为了克服目标函数不可导的困难

转化成下面这么一个连续变量

有约束的一个优化问题

然后怎么叫连续变量 大家看

这个里面就是 对于

在这个N个样本中

我所有的

跟我这个目标函数的

对应的目标函数

要求的估计出的函数

跟我们实际的这个值之间的误差

为了使这个绝对值去掉之后

我们知道它一定最后下来

它要么≥-λ ≤λ

它是有边界的

负的边界也好

正的边界也好

但是不管怎么样

在这个所有边界里面

所有最大的那个边界里面

我仍然让它最小化

也就说我把它

对应这个边界限制是λ之后

我让它做λ最小

这个问题和上面这个问题

实际上大家可以看到它是完全等价的

一个问题

那你为什么要把它化成这个问题

这个问题化完之后最大的好处在哪

我们马上再来 就说

特别是当我们把这个

要估计的这个有参数的f(X)

和这个参数θ之间

表示成线性函数的时候

什么是线性函数 就是我把f(X)

是可以写成这个φ

这个φ是一种基函数

它的线性组合

这种我们叫可加性模型

这个太多了

比如说咱们现在可以看到

绝大多数用的神经网络里面

包括支持向量机里面

它的形式都是这种形式

那么这里面

比如说φ我们熟悉的

比如说在别的课堂

你遇到过我们用高斯核函数

那么下来

每个高斯核函数之间的线性组合

那当然这里我用到多少高斯核函数之后

就可以得到我们对应的一个期望的

拟合的一个f(X)出来

那么写成是这个决策变量θ

就是这个待定函数θ

这个线性函数的时候

大家再重新看一下

我们这个有约束的连续变量优化问题

这里面

对这个θ来说

它的约束条件是线性的

目标函数值

当然也是线性的

所以

这个问题就转化成一个 这个优化问题

就变成一个线性规划问题

这个转化的意义可就大了

这个非常大了

因为你可以看到

当我们采用这个

无穷范数来去刻画这个优化问题的时候

带来所谓的不可导的一个困难

但是因为我们有了线性规划对应的知识

我们把它转化成

等效的线性规划模型的时候

这个问题的求解就变得极其容易

我们在后面的线规划的课程里面

会给大家介绍对应求解这样

线性规划问题的一个一般性的方法

就是单纯形法

这个方法的效率非常高

当然还存在它理论上的一些问题

这都是后话

我们慢慢的给大家就讲

那是高到什么程度呢

就是如果真是客观中这样的一个问题

我们转换完之后

哪怕这个问题里面

你选择这个基函数的数量哪怕是

成百上千甚至以十万级做这个做计量的

这个问题

那么转化成线性规划之后

它的求解速度用我们现在这个

计算机的效率

也在一秒钟之内可能就能完成

所以效率是非常高的

所以可以看到

就是因为有这样的知识

有了对应的我们

线性规划这样的模型特点

以及对应求解的高效算法

我们是可以把

实际里面用无穷范数去表示

这种优化问题不好解决的问题

也可以很好的解决掉

运筹学课程列表:

1. 绪论

-课程主要内容1

-课程主要内容2

-课程学习方法1

-课程学习方法2

-课程学习方法3

-作业-绪论

2. 线性规划

-2.1 ⼀般模型和标准模型

--2.1.1 线性规划模型

--2.1.2 线性规划的标准模型

--作业-线性规划模型

-2.2 低维问题图解法及其向⾼维的推⼴

--2.2.1 低维问题的图解法1

--2.2.2 低维问题的图解法2

--2.2.3 从低维问题分析线性规划问题的最优解特点1

--2.2.4 从低维问题分析线性规划问题的最优解特点2

--作业-低维问题的图解法

--2.2.5 凸集

--2.2.6 凸集的顶点

--2.2.7高维问题顶点的等价表述1

--2.2.8高维问题顶点的等价表述2

--2.2.9推广到高维的重要概念与性质

--作业-高维问题及其性质

-2.3 单纯形算法

--2.3.1在顶点中搜索最优解的算法

--2.3.2计算选定进基变量的基本可行解

--2.3.3保可行性的最小非负比值原理

--2.3.4无非负比值的情况

--作业-单纯形算法1

--2.3.5选择进基变量改进目标函数1

--2.3.6选择进基变量改进目标函数2

--2.3.7单纯形表

--2.3.8最优性判据

--2.3.9单纯形算法的基本步骤

--作业-单纯形算法2

--2.3.10单纯形算法的收敛性

--2.3.11退化情况1

--2.3.12退化情况2

--2.3.13初始基本可行解的确定方法

--2.3.14基于逆矩阵迭代的单纯形算法

--作业-单纯形算法3

-2.4 对偶性与对偶算法

--2.4.1线性规划对偶问题概述

--2.4.2标准线性规划的对偶问题

--2.4.3一般形式线性规划的对偶问题

--2.4.4原问题与对偶问题的互补松弛性1

--2.4.5原问题与对偶问题的互补松弛性2

--作业-对偶性与对偶算法1

--2.4.6影子价格1

--2.4.7影子价格2

--2.4.8对偶单纯形法1

--2.4.9对偶单纯形法2

--2.4.10对偶单纯形法3

--2.4.11对偶单纯形法4

--作业-对偶性与对偶算法2

-2.5 灵敏度分析

--2.5.1灵敏度分析

--2.5.2参数线性规划

3. 整数线性规划

-3.1 整数线性规划的数学模型

--整数线性规划概述

--作业-整数规划概述

-3.2 割平⾯法

--3.2.1割平面法的基本原理

--3.2.2割平面的构造方法1

--3.2.3割平面的构造方法2

--3.2.4割平面方法例题1

--3.2.5割平面方法例题2

--作业-割平面法

-3.3 分枝定界法

--3.3.1分枝定界法1

--3.3.2分枝定界法2

--作业-分枝定界法

-3.4 0-1变量的作⽤

--3.4.1 0-1变量的作用1

--3.4.2 0-1变量的作用2

--作业-0-1变量的作用

4. 动态规划

-4.1 动态规划基本概念

--4.1.1动态规划基本概念

--4.1.2动态规划的无后效性

-4.2 最优性原理

--动态规划的最优性原理及计算量

-4.3 建模与求解

--4.3.1动态规划解非线性规划问题1

--4.3.2动态规划解非线性规划问题2

--4.3.3连续变量离散化求解

--4.3.4动态规划解整数规划问题

-4.4 典型应⽤问题

--如何满足动态规划的无后效性

-4.5 不定期动态规划问题

--4.5.1不定期问题

--4.5.2值迭代法

--4.5.3策略迭代法1

--4.5.4策略迭代法2

-作业-动态规划

5. ⾮线性规划

-5.1 基础知识

--5.1.1 非线性规划概述

--5.1.2 局部最优解与全局最优解

--5.1.3 梯度与海塞矩阵

--5.1.4 泰勒展开

--5.1.5 凸函数和凹函数

--5.1.6 多元凸函数的判别

--5.1.7 多元凸函数与一元凸函数的关系

--5.1.8 凸函数的一阶条件

--5.1.9 凸函数的二阶条件

--5.1.10 凸规划问题

--5.1.11求解非线性规划的基本方法

--作业-非线性规划基础知识

-5.2 ⼀维搜索

--5.2.1 一维精确搜索的性质

--5.2.2 精确搜索的基本途径

--5.2.3 0.618法

--5.2.4 Fibonacci法

--5.2.5 利用导数的精确搜索法

--5.2.6 非精确搜索

--作业-一维搜索

-5.3 ⽆约束优化

--5.3.1 无约束优化的最优性条件

--5.3.2 负梯度方法及其缺陷

--5.3.3 广义牛顿法

--5.3.4 牛顿法的缺陷

--5.3.5 最速下降方向

--5.3.6 共轭梯度方向1

--5.3.7 共轭梯度方向2

--5.3.8 共轭梯度方向3

--5.3.9 共轭梯度法计算示例

--5.3.10 共轭方向的线性无关性

--5.3.11 共轭方向与一维最优解的梯度的正交性1

--5.3.12 共轭方向与一维最优解的梯度的正交性2

--5.3.13 共轭方向二次函数有限终止性

--5.3.14 共轭方向的生成

--5.3.15 三种共轭梯度法

--5.3.16 几种算法的性能比较

--作业-无约束优化

-5.4 约束优化

--5.4.1 有约束优化问题最优性条件概述

--5.4.2 不等式约束的分类

--5.4.3 线性不等式约束下的KT条件

--5.4.4 线性等式约束处理方式1

--5.4.5 线性等式约束处理方式2

--5.4.6 线性等式约束处理方式3

--5.4.7 KKT定理

--5.4.8 转化为无约束问题的方法

--5.4.9 KKT定理的构造性证明1

--5.4.10 KKT定理的构造性证明2

--5.4.11 求KT解的一般性方法

--5.4.12 凸优化问题KT解的性质

--作业-约束优化

-5.5 简约梯度法

--简约梯度法

-5.6 拉格朗⽇对偶

--拉格朗日对偶

6. 图与⽹络分析

-6.1 基础知识

--6.1.1 图与网络分析的应用

--6.1.2 图与网络的基本概念1

--6.1.3 图与网络的基本概念2

--6.1.4 图与网络的矩阵描述

--作业-图与网络基础知识

-6.2 最⼩⽀撑树问题

--6.2.1 树的概念与特性

--6.2.2 支撑树与最小支撑树

--6.2.3 求最小支撑树的避圈算法

--6.2.4 求最小支撑树的Dijkstra算法1

--6.2.5 求最小支撑树的Dijkstra算法2

--作业-最小支撑树问题

-6.3 最短路问题

--不定期最短路问题的Dijkstra算法

--作业-最短路问题

-6.4 最⼤流问题

--6.4.1 最大流问题描述

--6.4.2 最大流问题的矩阵表示、割集容量定义

--6.4.3 可增广链求最大流

--6.4.4 最大流最小割定理

--6.4.5 求最大流的标号算法

--作业-最大流问题

-6.5 最⼩费⽤流问题

--6.5.1 最小费用流问题描述

--6.5.2 求最小费用流的启发式算法

--6.5.3 最小费用流问题的KKT条件1

--6.5.4 最小费用流问题的KKT条件2

--6.5.5 基于互补松弛定理求解最小费用流的一种途径

--6.5.6 满足互补松弛条件的可增广链

--6.5.7 保持互补松弛条件的增广方法

--6.5.8 示例寻求可用边和可增广链

--6.5.9 沿可增广链改进最小费用流

--6.5.10 寻求可增广链的最短路等效

--6.5.11 等价的最小费用流求解算法

--6.5.12 再看最小费用流启发式算法

--作业-最小费用流问题

-6.6 运输问题

--6.6.1 运输问题的特点

--6.6.2 用单纯形法求运输问题

--6.6.3 运输问题的基本可行解

--6.6.4 如何在图上确定基本可行解

--6.6.5 图的支撑树与基本可行解的关系

--6.6.6 产生基本可行解的最小元素法

--6.6.7 通过对偶变量计算检验数

--6.6.8 计算检验数的位势法

--6.6.9 更新支撑树改进基本可行解

--6.6.10 运输问题特殊情况处理办法

--作业-运输问题

-6.7 指派问题

--6.7.1 指派问题的特点

--6.7.2 运输问题算法求指派问题的缺点

--6.7.3 指派问题系数矩阵的性质

--6.7.4 指派问题求解算法设想

--6.7.5 在图上搜索最大独立零元素组

--6.7.6 二分图对集的相关性质

--6.7.7 求最大对集的标号法

--6.7.8 最大对集最小覆盖

--6.7.9 特殊指派问题处理方法

--作业-指派问题

课程学习方法2笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。