当前课程知识点:环境类专业野外实习与实践 > 第十三章 野外调查数据 > 13-2 野外调查数据的整理 > 13-2 野外调查数据的整理
第二节是这个野外调查数据的整理
就是说我们拿到了一些数据以后
我们怎么进行整理
整理成图和表
一般的我们把它表现出来包括图和表这两种形式
首先来看一下这个统计表
其实图和表大家都可能会一些
但是从规范性上
可能大家还有一些需要提高的一些内容
统计表我们知道像这样的把一些数据用表格的形式
来表示的这样的表都叫做统计表
这个表里面我们其实一目了然
它的一些信息
它的一些数字特征都在里面了
都在里面
大家看一下这两个表好像有点区别是不是
都是讲的是我们坝上地区
它的海拔监测月份和监测的气温
但有什么区别
大家可以看一下这个表是不一样的
这个表我们把它叫做一维表
其实就是一个流水线表
它的特征是表中每一列都是一个单位
大家看一下每一列都是一个单位
站名点海拔月份和气温
除了一维表之外的其它所有的表叫二维表
我把这个数据进行了整理整理成了二维表
这个二维表的特征是同一个因素
比如说气温
它是多列显示的
这两个表有什么区别
或者是我们什么时候用
就是说我们在进行第一手数据
你在数据记录的时候
或者在你整理数据库的时候
一般的我们都用一维表
因为这个以后处理起来很好处理
这个一维和二维表它是可以转换的
我们在这个excel里边
它就可以通过透视图或透视表的
这种方法可以进行这个互换
大家了解一下
就是我们在一般发表文章的时候
我们习惯用二维表
但是在做数据记录的时候
我们喜欢用一维表来进行这个记录
这个再讲一下三线表
就是我们在写科技论文也好
我们在整理我们的报告的时候
我们通常用三线表来表示
什么叫三线表
给大家举个例子这个就是三线表
三线表它的比较简洁 功能也比较分明
大家一目了然阅读很方便
这里边通常为什么叫三线表
它有三条线
但是并不是说只有这个顶线底线和这个栏目线
它有的时候也会加一些辅助线的这种形式
但是它仍然是三线表
这里边有五个组成要素
一个是表序就这个表1
表1就是表序
它的表题 样地内灌木生长的状况
还有项目栏 这是项目栏
整个就是它的一个表体
还有下边一行小字大家可以看一下
那个叫表注
一般时候我们在后边会加一个注字
注冒号就是一个什么
后边的一个标注的一个东西
这里边我们一般这个习惯是这个
表序和表题在表格的上方
表中是在表格的下方
这个大家要注意
因为以往有的学生这个在调查的报告
就是把表题放在下边
这个是不规范的
大家看一下这三个表内容都很接近
哪个表是对的
哪个表是符合我们的科技论文的一个要求
大家可以看一下
第一对不对
为什么
它不是三线表是吧
它凭空在这个项目栏里边多加了一行
它是不是三线表了
然后第二个它错在哪
实验组这个对照组这个写法上不简练
第三个它是一个标准的一个三线表
大家看一下不止是三条线是吧
这加了一个辅助线
但是仍然叫做三线表
这个是科技论文也会用
这是表 表一般比较简单
就是我们可以给大家提供第一手的这个数据
统计图就分很多种
包括这个直方图条形图箱式图散点图线图
还有饼图还有统计地图
这些图我们是要选择不同的场合进行施用
我们需要注意的是什么
就是我们这些表
它和它的数据结构是有一个对应关系的
并不是说你随便弄两列数
我就可以做任何一个图
你需要整理成它相应的数据结构
才能做出这个图来
对于统计图绘制也有一些要求
第一个是我们的横纵坐标要有刻度
要有单位
这个有的同学不太注意
就是BOD5也不写单位是吧
也不写单位
BOD5我还可以理解
比如说盐度你用的是哪个标准
哪个单位这个差别很大
第二条是横轴它是从左到右
纵轴是从下向上
数值是由小到大
图形比例宽度是5比4 6比5
这个通常是为了我们就是发表在科技论文里边
它那个排版的需要
就是你一步到位的做成了这样的图以后
就不需要再反复的修改了
就是我们就争取做到这样的一个程度
第三个是图中需要有
用不同的颜色或线形来表示不同的事物的时候
要有图例
就是有的同学用盖度 多度 重要度值
然后画三个曲线
这个三个曲线一看都一样
或者有不同的颜色表示了
但是没有标明不同的颜色表示的是什么
这个是需要大家注意的
另外一个是标题是和表是相反的
它是要列在这个图的下方
我们先简单来看一下这个几个图的这个特征
首先这直方图我们刚才讲这个样本分布的时候
其实我们画出来的是什么
直方图是吧
直方图它是根据这个频次分布表
以这种频次的这种形式表示它的一个分布
它的做法也是我们把这个数据从
最小值到最大值这个区间
给它进行一下等距的一个分组
这个分组一般是5到15个
分组以后我们把它作为横坐标
然后落在这个区间内的这个值
我们就统计它的次数
不是它的本身的值了
这个次数表示它的纵坐标
这样的话做出来的这个矩形
就是这个频数的分布图
但是往往我们说做这个图的目的
我们通常是想看它是不是正态分布
当然了也可以是其它的分布
但是我们总是希望它是正态分布
可能好这个分析一些
假如说是一个正态分布
那我们通过肉眼去看
这一些点是不是在一条直线上很容易
我们想了解一些点
是不是在一个标准的曲线上就很难了
那我们通常怎么做
我们通常通过一些软件
比如说smart
就可以把这个曲线图给它转换成线图
这个叫qq图这叫pp图
它表明的是这个我们实际的数据
它的累计概率分布和理论上的那个分布
它是不是在一条直线
如果这个吻合的好的话
说明它就是正态分布的
如果吻合的不好
它就是我们怀疑它不是正态分布
除了这个当然也还有一些其它方法
比如说用ks检验
我们回头再讲
这是直方图
也就是直方图的目的我们通常是想看它的分布
看它的分布
另外一个条形图
条形图它是用这个等宽长条的一个长短
如果我们是横的就是长短
如果是竖的就是高低
来表示某一个指标属性和种类
它的一个频次分布
它和直方图有点像
但是它的目的其实想分析什么
某一个事物在同一个时间它的变化情况
或者是什么
某一个数在不同时期的一个变化情况
这个是想对比用的
通常有两种形式
一种是叫单式的长条图
就是说如果只有一个指标属性
我们就做单式的
如果是有多个可以做成复式的这种长条图
但这种长条图大家一定要标明它的比例
就是蓝的是什么
灰的是什么
这个黄的是什么
要标出来
另外一个是箱式图
这个箱式图可以展示什么
就是展示我这个数据组它的一个极值情况
极值
这个可以是最大值
也可以我所标识的一个上限下限
这个图里边其实包含了很多很多信息
就是我们数据量如果在50到100个的时候
我们想充分表现出这个数据的分布来
我们可以用箱式图
最少也得20个
如果低于20个我们就不要用这个图了
这个图能反映出什么
我们把这个数据从小到大排列
排列到从小第25%个数的时候
25%个数的时候
它的这个数字就叫做下四分位数
50%的数叫做中位数
75%的数叫做四分位数
下和上四分位数之间的这个距离
我们把它叫做IQ2这个叫四分位距
这个四分位距它的1.5倍
如果再加在这个上四分位距上
得到这个点叫做上限
如果是这个Q1下四分位数
减去1.5倍的这个四分位距以后
这个值叫做下限
我们一组数我们给它分布在这上面的话
有的数据显然是高于上限或者是低于下限的
高于上限或低于下限的这些值
我们通常也把它视为异常值
通常也把它视为异常值
你就可以重点去考虑它是不是在进行检验
看它是不是异常的
这是这个箱式图
这个箱式图用来做什么
除了展示你看我这个数据
它大概是一个什么形态之外
它还可以考虑它的一个偏度和尾重
什么叫偏度
假如说我的算术平均值在这
它和中位数之间的这种偏差的大小
其实反映了数据的一种偏态
尾重就是说我这个两头
如果是一个正态分布大家都学过
它是一个两边很对称的一组数列
如果这节和这节不太对称
特别偏离偏上
就是这个数据都偏大的这个比较多
如果是偏下一点说偏下的多一些
另外这个图的用途还可以比较几组图的形状
比如说我在这个不同的区域采的样
然后我想分析一下它的数据的一个分布
做一下对比
我们可以用这个箱式图来很直观的来表示出来
再一个就是散点图
这个也是用的最多的一个类型
我们通常就是针对的是这个两个变量
就x y之间我想看它有没有相关性
有没有相关性的时候
我们通常就把x y分别作为两个轴
然后我们就把它作为一个散点
来发现本来没有关系的这两个值
看看它有没有一个相关关系
这是这个散点图
这个用的也很多
再一个是线图
线图通常是表示这个事物随着时间变化的情况
它有点像条形图是吧
但是它是把这个趋势表示出来了
把这趋势表示出来
当然它也是分为单式的这个线图和复式的线图
但是我们需要注意的一点是
这个线图我们通常是连的是直线
有同学说我给它拟合一下
看着圆滑一点好像更美观一些
但是你要是想做成圆滑的这种曲线的话
那一定要有物理意义
没有物理意义的话你不要给它拟合
就说你这个曲线
比如说从这一点到这一点它是直着下来的
它只是表明了一个趋势
你把它拟合可能有一个弧度
或者有个凹凸的这种趋势没有根据的
没有根据没有意义
就比如说我们在正在调查当中
我们通常比如说我们要测公路的噪声
它在一天内它的一个分布数
我们可以用这个线图来表示
或者是一个我们分析这个河流水质随机的变化等等
我们都可以做成线图
下一个是饼图
这个饼图通常是我们想看一个占比的时候
比如说某一个资料它的不同的构成的时候
我们通常用饼图这样的话很直观
你比如说我们土地利用类型它的一个占比
比如草地林地还有这个居民用地
它分别占一个多大的比例
这个我们就可以通过这个饼图的这个来表示
最后一个是比较复杂的这个统计地图
统计地图它一般包含两个信息
一个是地图
还有一个是这个统计信息
这个地图通常就是可以是行政区域图
也可以是流域图
也可以是这个小的一个某一个区域这样的一个地图
我们从这个图上去反映这个不同地区
它的一个社会经济的一些现象或数据特征
比如说这个是中国的
在2001年的一个土地利用的一个分布图
大家看一下
它这个里边除了这个地图之外
它还有一些用颜色表示的一些信息
包括林地
然后那个其它的这个聚共用地等等
它包含的这些信息
这种图叫做这个统计地图
还有这个在一个小区域上
一个小区域上这个三角洲区域
它的一个植被的一个水分风险的一个分布情况
当然这个数据是经过复杂的这种模型的运算获得的
但是它追根结底它还是两层信息
一层是这个地图信息
一层是这个统计信息
好 这一讲就给大家介绍到这
好 谢谢
-野外实习目的和意义
-野外实习基地建设
-野外实习组织管理
--野外实习组织管理
-地质地貌的观测与识别
-5-1 大气环境要素的观测与识别
-5-2 大气环境要素的观测与识别实操
-6-1 声环境要素的认识与观测
-6-2 声环境要素的认识与观测实操
-7-1 土壤环境要素的认识与观测
-7-2 土壤环境要素的认识与观测实操
-8-1 水环境要素的认识与观测
-8-2 水环境要素的认识与观测
-8-3 水环境要素的认识与观测实践
-8-4 水环境要素的认识与观测实践
-9-1 生物群落的调查与观测一
-9-2 生物群落的调查与观测二
-9-3 生物群落的调查与观测三
-9-4 生物群落的调查与观测四实操
-9-5 生物群落的调查与观测五实操
-9-6 生物群落的调查与观测六实操
-9-7 生物群落的调查与观测七实操
-10-1 生态景观的调查与分析
-10-2 生态景观的调查与分析实操
-11-1 社会经济环境的调查与分析
-12-1 流域环境管理与规划
-13-1 野外调查数据的特征
-13-2 野外调查数据的整理
-13-3 野外调查数据的t检验
-13-4 野外调查数据的方差分析
-14-1调查报告的撰写
-14-2 研究论文的撰写
-15-1 实习总结
-15-2 实习总结