当前课程知识点:环境类专业野外实习与实践 >  第十三章 野外调查数据 >  13-1 野外调查数据的特征 >  13-1 野外调查数据的特征

返回《环境类专业野外实习与实践》慕课在线视频课程列表

13-1 野外调查数据的特征在线视频

13-1 野外调查数据的特征

下一节:13-2 野外调查数据的整理

返回《环境类专业野外实习与实践》慕课在线视频列表

13-1 野外调查数据的特征课程教案、知识点、字幕

大家上午好

今天我来给大家讲野外调查数据的统计处理

那么统计处理我们主要分为四个小节

四个小节是主要是一个是这个数字的特征

还有一个是他的一个整理

再一个就是他的后边的分析

那么第一节是关于野外调查数据的数字特征

那么主要包括我们的样本

还有包括它的分布和数字特征以及离群值

我们怎么去处理

那么我们首先来看它的样本

我们先讲一下生态调查中的这种统计学思维

因为我们野外的这种生态学的调查

它是一种非常重要的一种生态学的方法

那么这种调查可以给我们提供第一手的数据

从而通过这些数据去揭示生态系统 景观

以及生物要素和非生物要素之间的

这种相互作用关系

也就是所谓的我们的环境科学的一些规律

那么我们生态调查

它所面对的是一个复杂的变化的

这样一个自然过程

那么在这个自然过程当中

也包含一些不确定性的因素

所以在我们在调查的过程中

也需要用一些统计学的思维来分析我们的数据

我们知道

我们在进行野外调查的一个数据的分析

是作为我们整个实习课程的最后两章

那么我们并不是说

我们的数据决定我们的数据处理方法

而是由我们的数据处理方法

来决定我们数据的采集

就是说我后面要用什么样的处理方法

其实就决定了你前面你要采集哪些数据

如果你一旦错过去了

可能后边没法补

所以说我们也在去野外调查之前

首先要了解一下

我们需要用哪些统计学的一些思想和方法

首先我们先介绍一下几个概念

就关于总体

那么这个总体是什么

我们以前也接触过

那么他是研究对象的所有观测的一种可能性

我们一般都用N来表示

那么总体是由个体组成的

组成总体的每一个单元都叫做

把它叫做个体

我们知道总体的性质也是由个体来决定的

如果我们把每个个体的性质我们掌握到

我们就了解了总体的性质

但是这种情况往往是不能实现的

大家想为什么

那么有两种情况

第一种情况是如果总体是无限总体

假如说我们在野外

想调查草地的生物多样性

想调查土壤的理化性质

那我们不可能把这个区域内

或流域内的每一个植被

每一个样本都能拿到一一检测

那么还有一种可能性

是我们的实验是具有破坏性的

这种破坏性它就决定了

我们不可能逐一的去了解每一个个体的特征

要求我们就是说在野外采集的过程中

要通过样本

也就是选择我们代表性的个体去加以研究

在通过样本去反推总体

所以说样本就是说从总体中抽取出来的

每一个研究的个体就叫做样本

那么个体的数目我把它叫做样本容量

也叫做样本量

比如说我们在测河流的水质的时候

我们采集的水样

测土壤理化性质的时候

我们采集的土样

包括一些植被的生物量

植被的生物多样性

那么我们在监测的时候

所设的样方都叫做样本

都叫做样本

那么我们需要了解的是

就是说在任何情况下

我们研究的对象都是样本

都是样本

但是我们所揭示的是什么

是总体

这是总体和样本间的关系

我们是通过样本来研究总体的

所以说我们通过调研

再通过各种处理的方法

得到的结论都是针对总体而言的

这一点需要同学们十分的注意

那么我们对采集样本的样本有一些要求

刚才董老师也讲了

我们怎么去设置样方

那么其中里边就渗透了一些思想

就是说我们的样本在设计的时候

一定要有代表性

什么叫代表性

代表性它就是每一个样本区

再现或反映总体的属性的这种程度

当然了代表性越高

我们通过样本去反推总体

推断的结论是越可靠的

反之就是越低的

那么另一个是它的典型性

什么叫典型性

大家其实体会一下

样本的代表性和典型性是不同的

是吧

那么典型性是样本集中体现在某一类

这个现象的重要特征

它不一定是代表性的东西

再一个是它的一个准确性

那么准确性我们所谓的对样本的代表性也好

对它的一个典型性的要求也好

都是为了保证样本的准确性

尽可能的满足我们的要求

那么对于样本量的确定

大家可能也是一个很疑惑的一点

我们在实际的当中

我们采集多少个样本合适

那么我也看了一些相关的

一些论文书籍有很多说法

那么有的说样本的观测数

我们是需要是待估参数的5到10倍

也有的说是3倍

那么也有说样本容量要最少8个

我才能有统计意义

那么也有说大于30才是大样本

小于30就是小样本

那么到底多少个样本是合适的

这个是其实大家在实际操作的时候

你可以去灵活的处理

但是在理论上大家要知道

从理论上是有一个关系的

就是说理论上的样本量

它是由几个因素决定的

一个是我们允许犯错的一个水平

就是这个概率和你正区间有关系

然后另一个是和我们总体的方差

行为方式有关系

还有一个是和样本的允许误差

也就是说有的时候是允许你犯错

程度稍微大一点

有的时候小一点

那么这个就它的平方成反比

所以说从样本量的确定上

我们从理论上大家一定要知道

就是有这么一个关系是存在的

但是实际处理的时候

比如说有的同学可能说了

那么这个方差δ2很难找到我怎么去处理

你可以借助一些文献

那么我们所有的研究都是建立在

前任的工作的基础上

那么我们去调研对于相关的研究

它的总体方差是多少

那么我们可以参考

那么如果没有我们也可以做一些预实验

去获得这样的一个结果

那么当然允许误差是有我们主观的因素

那么比如说我们举个例子

假如说我们要估计某一条河流

每天的一个平均流量是多少

那么在这里边每日的平均流量的标准差是5

5个流量

那么我们要求评估每个平均日日流量

这个置信度是95%

也就是1-α是95%

α是5%

那么允许误差是2

那么我们到底应该

采多少个样才能满足我们的要求

那么这里边我把当成无限总体

那么也可以当做有限总体的话

假如说我就一年365天

我从里边抽取多样本

那么这种情况下公式可能有点差别

这里我们不做叙述了

那么假如说是一个无限总体

你可以跨年不在一个自然年的范围内的话

那么这样的话我们把这个数据带进去

大家发现是24.01

那么就是说

如果我到25天的时候监测25个样本

我就可以能够保证我的允许的误差

这是我们的一个样本

就说你采25个样的时候就是可以的

这是我们一个从理论上的一个确定

第二块就是调查数据的分布和数字特征

因为我们知道一个总体而言

那么它有三个量就能决定总体的分布

一个是它的一个特征

那么一个是分布

一个是它的平均数

也是它的方差

那么从我们采集的数据里来说

它也是包括这几个方面

那么第一个是样本的分布

那么我们通常把样本的数据

在一定取值范围内分几个区间

这个区间通常是5到15个

5到15个比较合适

那么统计数据落在每个区间上

我们去统计它的次数

这样的话得到的就是样本的频数

那么我们把频数和总的样本量

去求一下这个比例

我们就能得到它的相对频数

然后我们把它进行作图

就会得到如下边的这样的一个

频数的一个分布图

那么频数的分布图通常是用直方图来表示

那么第二是这个平均数

那么平均数是我们最常见

也用得最多的这样一个统计量

那么它表明了我们在统计资料

我们调查的数据当中

各个观测值相对集中的这样的一个位置是多少

那么我们有这么几种常用的平均数的方法

但不限于这几种

那么第一个是算术平均数

也就是大家都熟知的

就是我们所有的值给它加起来

除以它的测定次数

那么这个算术平均数大家需要注意的是

不是说什么场合我都可以用算术平均数

就是当我的数据满足正态分布的时候

或者是近似正态分布的时候

我们才可以用算术平均数

这是需要大家注意的

那么另外一个是中位数

就什么是中位数

中位数就是把我们的数据从小到大依次排列

那么我们取一个中值就是位于中间的这个值

就叫中位数

大家想一想

如果这里边是偶数怎么办

取中间两位的一个平均值

那么里边有重复数怎么办对

如果是有重复数

我们可以把这个重复数剔除掉

再重新排列

最后得到的中间的值

需要大家注意一下

那么方差是表明样本的偏离程度

因为我们知道平均数它表明的是中值的位置

那么方差是表明它的一个偏离的

均值的一个程度

所以说我们这个量

也是一个非常重要的一个概念

那么我们在有的时候做图的时候

其实大家看一下这个图

它除了反映的是平均值的这个值之外

它还反映了有一个所谓的误差棒

这误差棒是什么

就是S的值

这是要体现出来的

那么另外一个就是在我们野外调查的时候

经常会出现有些数特别大特别小

就是说它的值好像跟其他的不是很一致

那么这些值怎么办

我们到底舍弃不舍弃

这个也是需要进行相应的检验才能确定的

比如说如果我们要去除单个的离群值

比如说我一组数据当中我们发现这个值特别大

我还要不要统计它

那么我们在这里

是可以用格拉布斯的这种方法进行统计

这个方法也很简单

它是把我们的公式值从小到大进行排列

排列以后

假如说我觉得这个值特别大

我想考察最大的要不要

我们就采用这个公式

这个公式就是

我用最大的一个值减去X1指它的平均值

算术平均值

然后再除以S

S是什么

刚才我们所说的标准差是吧

标准差

那么如果Gn大于我们的临界值的话

我们把它剔除掉

如果小于的话

那么就不用剔除了

如果我想判断的是最小的值

某一个值在这个数组里边特别小

我要不要他

我采用下边的值

同样也是G1如果大于临界值的话

那么我们就给他舍弃掉

那么这是给出了一个临界值

这个都是已经有表可查的

那么N代表的是它的样本量

那么横坐标是它的一个显著性水平

那么大家可以查相应的表就能获得

那么这里边有这么几项需要注意

就是说如果G1和GN大于临界值

它是异常的

我刚才也说了

那么第二个需要大家注意

就是说我们格拉布斯方法

它是用来去除单个的离群值

你不要连续去除

连续去除就不对了

我们要是连续去除的时候就不要用这种方法了

还有别的方法可以遵循

那么在计算S的时候

可移植也是要计算在里边的

因为你是计算统计量是包含在那个里面

包括X1它也是包含在里边

那么如果是多个离群值

我们是用狄克逊方法

那么这个方法它是用极差比的这种方法

进行确定的

也就是说他考察当样本在不同范围内的时候

可移植的统计量是不同的

是不同的

大家可以按照相关的公式进行计算就可以了

我就不在这说了

这也是当D最小值和D最大值

大于我们的临界值的时候

我们就考虑剔除

这是从理论上来讲

它的统计量是怎么计算

如何进行判别

但是实际上

我们通过检验以后发现它确实是离群值

我们就把它直接剔除

你得剔除的

是不是有的时候心里也不会特别踏实是吧

我们其实还需要结合一下我们实际当中

你再去回忆我们在得到这个数据的时候

或者你看你的记录本上这个数据

它是不是可靠的

就是说有没有一些比较低级的错误在里面

如果有的话你就比较有把握了

比如说我们是不是测试的时候

这个步骤是不是少了一部或者多了一步

是不是标准方法

那么或者是我们储存的时候

前处理我们没有进行固定

是吧

这有可能也会导致它后边的数据的一个差异

或者是我记录的时候是不是多记了一个位数

这个小数点有偏差是吧

或者是数据处理的时候是不合适的

所以说如果我们回忆一下

当时可能会有这种情况出现

那么我们就比较有把握把离群值去掉了

这是离群值的去除

所以说我们在实习以后

大家就可以把我们今天学的均值分布

标准差均方差等等

还有离群值的检验

可以去练习一下

结合我们各个小组的采集的样本

得到的数据去进行一下分析

我这节就讲到这

谢谢大家

环境类专业野外实习与实践课程列表:

第一章 野外实习目的和意义

-野外实习目的和意义

--野外实习目的和意义

第二章 野外实习基地建设

-野外实习基地建设

--野外实习目的和意义

第三章 野外实习组织管理

-野外实习组织管理

--野外实习组织管理

第四章 地质地貌的观测与识别

-地质地貌的观测与识别

--地质地貌的观测与识别

第五章 大气环境要素的观测与识别

-5-1 大气环境要素的观测与识别

--5-1 大气环境要素的观测与识别

-5-2 大气环境要素的观测与识别实操

--5-2 大气环境要素的观测与识别实操

第六章 声环境要素的认识与观测

-6-1 声环境要素的认识与观测

--6-1 声环境要素的认识与观测

-6-2 声环境要素的认识与观测实操

--6-2 声环境要素的认识与观测实操

第七章 土壤环境要素的认识与观测

-7-1 土壤环境要素的认识与观测

--7-1 土壤环境要素的认识与观测

-7-2 土壤环境要素的认识与观测实操

--7-2 土壤环境要素的认识与观测实操

第八章 水环境要素的认识与观测

-8-1 水环境要素的认识与观测

--8-1 水环境要素的认识与观测

-8-2 水环境要素的认识与观测

--8-2 水环境要素的认识与观测

-8-3 水环境要素的认识与观测实践

--8-3 水环境要素的认识与观测实践

-8-4 水环境要素的认识与观测实践

--8-4 水环境要素的认识与观测实践

第九章 生物群落的调查与观测

-9-1 生物群落的调查与观测一

--9-1 生物群落的调查与观测一

-9-2 生物群落的调查与观测二

--9-2 生物群落的调查与观测二

-9-3 生物群落的调查与观测三

--9-3 生物群落的调查与观测三

-9-4 生物群落的调查与观测四实操

--9-4 生物群落的调查与观测四实操

-9-5 生物群落的调查与观测五实操

--9-5 生物群落的调查与观测五实操

-9-6 生物群落的调查与观测六实操

--9-6 生物群落的调查与观测六实操

-9-7 生物群落的调查与观测七实操

--9-7 生物群落的调查与观测七实操

第十章 生态景观的调查与分析

-10-1 生态景观的调查与分析

--10-1 生态景观的调查与分析

-10-2 生态景观的调查与分析实操

--10-2 生态景观的调查与分析实操

第十一章 社会经济环境的调查与分析

-11-1 社会经济环境的调查与分析

--11-1 社会经济环境的调查与分析

第十二章 流域环境管理与规划

-12-1 流域环境管理与规划

--12-1 流域环境管理与规划

第十三章 野外调查数据

-13-1 野外调查数据的特征

--13-1 野外调查数据的特征

-13-2 野外调查数据的整理

--13-2 野外调查数据的整理

-13-3 野外调查数据的t检验

--13-3 野外调查数据的t检验

-13-4 野外调查数据的方差分析

--13-4 野外调查数据的方差分析

第十四章 调查报告

-14-1调查报告的撰写

--14-1调查报告的撰写

-14-2 研究论文的撰写

--14-2 研究论文的撰写

第十五章 实习总结

-15-1 实习总结

--15-1 实习总结

-15-2 实习总结

--15-2 实习总结

13-1 野外调查数据的特征笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。