当前课程知识点:水资源系统分析理论与应用 > 第七章 系统评价方法 > 7.4投影寻踪评价法 > 7.4投影寻踪评价法
大家好
本次课程讲授投影寻踪评价法
首先介绍基本原理
投影寻踪方法的基本原理是
把表征系统属性的高维数据
投影到低维子空间上
对于投影到的构形
采用投影指标函数来描述
投影暴露某种分类排序结构的可能性大小
寻找出使投影指标函数达到最优
能反映高位数据结构和特征
的投影值
或根据该投影值
与系统实际的输出值之间的
散点图构造适当的数学模型
以模拟系统的输出.
接下来介绍投影寻踪聚类评价的基本步骤
1评价指标归一化
设指标体系样本集为X’(i)其中
为第j个评价指标第i个样本
p为评价指标总数
n为样本总数(样本容量).
为了消除各指标的量纲
和变化范围对评价模型的影响
使投影寻踪建模更具有一般性
需进行归一化处理
具体公式如下
(2)构造投影指标函数
投影寻踪方法就是把p维样本数据X(i)
综合成以单位向量A为投影方向的
一维投影值Z(i)
在投影寻踪时
要求投影值的散步特征应为
局部投影点尽可能密集
最好凝聚成若干个点团
而在整体上投影点团之间
尽可能散开.
因此
投影指标函数构造为
其中
为投影值的标准差
为投影值的局部密度
具体计算公式如下所示
3求投影方向
求投影方向A就是
求以下非线性优化问题
4聚类评价
将求解非线性优化问题(7.4-12)
所得的最佳投影方向A*代入式(7.4-5)
求得各样本投影值Z*(i)
投影值 与 越接近
表示样本X(i)与样本X(j)
倾向与分为同一类
按 从大到小排序
就可以将评价的样本集进行聚类
分类
实例分析
这是气候条件聚类评价问题.
黔西北地区地处贵州省西北部
全区辖毕节
大方
黔西
金沙
织沙
纳雍
威宁
赫章7个市县
该地区高山峡谷
地貌类型复杂
海拔高差悬殊
气候垂直分异明显
为了因地制宜地发展种植业
需要对该地区进行气候区划.为此
共采集了8个市县的
10个地形气候指标样本值
见下表所示
这属于投影寻踪聚类评价问题
求解优化问题(7.4-12)得到最佳投影方向为A
将求得的最佳投影方向代入式(7.4-5)
计算各样本(市县)所对应的投影值为
z(1)=1.295
z(2)=1.283
z(3)=1.722
z(4)=2.191
z(5)=1.728
z(6)=1.25
z(7)=0.271
z(8)=1.282.
由表7.4-1可知
投影值从大到小一次排序为4 5 3 6 1 2 8 7.
其中
样本4即金沙可以单位分为第1类
样本5、3、6、1、2即织金
黔西
纳雍
毕节
大方可以分为第2类
样本7即威宁单独分为第3类.
由求得的最佳投影方向分量的大小可知
地形气候指标
3
2
4
1
7
8
5
6
10
9
对气候区划结果的影响程度依次减小.
接下来介绍投影寻踪等级评价的基本步骤
1评价指标归一化
设根据水资源系统评价标准产生的
评价指标体系样本集及其相应的
标准等级为X‘(i)其中
为第j个评价指标第i个样本
p为评价指标总数
n为样本总数(样本容量)
为 相应的标准等级
等级评价模型就是根据样本
及其标准评价等级(7.4-3)
建立数学关系
当有了新的样本 时
就可以根据该数学关系
得到 所对应的评价等级
设第j个评价指标的样本均值
和标准差分别如公式7.4-14和7.4-15所示
评价指标归一化处理公式如下所示
2构造投影指标函数
归一化的样本数据X(i)
以单位向量A为投影方向的
一维投影值如公式7.4-17所示
在投影寻踪时
要求投影值尽可能多地提取样本中的变异信息
即要求投影值Z的标准差 尽可能大
同时投影值Z与评价等级Y的
相关系数的绝对值 尽可能大
因此
投影指标函数构造如下所示
3求投影方向
求投影方向A就是求以下非线性优化问题
4建立投影寻踪等级评价模型
将求解非线性优化问题(7.4-23)所得的
最佳投影方向A*代入式(7.4-17)
求得各样本的最佳投影值Z*(i)
等级评价模型需要根据投影值
与相应的标准评价等级Y(i)建立函数关系.
设最低评价等级为1
最高评价等级为N
一般用逻辑斯谛曲线(logistic curve)
逼近该等级评价函数关系
如公式7.4-24所示
其中
为待定系数
通过求解以下非线性优化问题得到
5等级评价
当有了新的样本 时
代入式(7.4-16)得归一化样本X
将X代入式(7.4-17)得投影指标z
将z代入式(7.4-24)就得评价等级计算值y
下面以洪水灾害等级评价问题为例
用投影寻踪等级评价方法
建立洪水灾情等级评价模型
进行灾情等级评价.
表7.4-2是利用
某省1950-1990年
共41年的实际灾情资料
进行分析得到
的洪水灾情等级标准
表7.4-3是某省洪水灾情资料.
根据表7.4-2采用
如下随机抽样方法
生成灾情等级样本系列
1确定评价指标为一般灾害的区间
左端点值一般取为右端点值的0.5倍
即成灾面积指标区间为(23.3,46.6)
直接经济损失指标区间为(4.75,9.5).
2确定评价指标为特大灾害的区间
右端点值一般取为左端点值的3倍
即成灾面积指标区间为(283.3,849.9)
直接经济损失指标区间为(85.0,255.0).
3这样
每个灾情等级对应的
每个评价指标取值均为一区间
对每个灾情等级对应的
每个评价指标取值区间
进行均匀分布随机抽样
生成5个随机样本
并取表7.4-2中的灾情等级
标准分界点各一次
相应的灾情等级值取为相邻的
两个灾情等级值得算术平均值
考虑到直接经济损失一般
与成灾面积具有正相关性
同一样本的直接经济损失的随机数应
与成灾面积的随机数相协调.这样
得到23个样本及其标准分类
见表7.4-4所示.
这属于投影寻踪等级评价问题
求解优化问题(7.4-23)
得最佳投影方向为A=(0.7388,0.6739)
将求得的最佳投影方向代入式(7.4-17)
得各样本所对应的投影值
见表7.4-5所示
将随机样本的投影值
与对应的标准等级值代入(7.4-25)
并进行优化求解式(7.4-24)中的参数
N=4,c1=-1.251,c2=-1.6219.
利用建立的等级评价函数关系式(7.4-24)
计算表7.4-3中的实际样本得各样本灾情等级
见表7.4-6所示.
本次课程到此结束
谢谢大家
再见
-1.1 水资源系统分析问题的提出
-1.2 系统的概念与系统方法
-1.3系统分析的概念和内容
-1.4水资源系统分析方法
-1.5水资源系统分析量化方法案例
-第一章测试
-2.1非线性优化数学模型与求解方法
-2.2最优性条件
--2.2最优性条件
-2.3一维优化与线搜索
-2.4无约束极值问题的解析法
-2.5二次规划
--2.5二次规划
-2.6约束非线性优化罚函数法
-2.7非线性优化直接方法
-2.8 SCE-UA算法
-2.9可变容差法
--2.9可变容差法
-第二章测试
-3.1多阶段决策问题
-3.2动态规划基本原理
-3.3水库优化调度建模及求解
-3.4 随机动态规划模型
-3.5水库优化调度实例
-第三章测试
-4.1遗传算法
--4.1遗传算法
-4.2粒子群算法
--4.2粒子群算法
-4.3蚁群算法
--4.3蚁群算法
-4.4狼群算法
--4.4狼群算法
-第四章测试
-5.1多目标规划问题与特点
-5.2多目标规划模型与解的概念
-5.3多目标规划求解方法
-5.4多目标规划的实例
-第五章测试
-6.1动态系统预测方法导论
-6.2时间序列方法
-6.3线性动态系统模型方法
-6.4 BP人工神经网络方法
-6.5支持向量机方法
-6.6洪水过程动态系统预报方法实例
-第六章测试
-7.1评价程序与评价指标
-7.2层次分析法
--7.2层次分析法
-7.3模糊综合评价法
-7.4投影寻踪评价法
-第七章测试
-8.1决策分析的基本概念
-8.2 不确定性的基本概念
-8.3 完全不确定型决策
-8.4 风险的多维度量
-8.5 风险型决策(1)
-8.6风险型决策(2)
-第八章测试
-期末测试
-期末论文