当前课程知识点:健康信息学 > 第四章 健康信息学的可视化技术 > 4.1健康信息可视化概述 > 4.1健康信息可视化概述
同学们大家好
我们今天来学习可视化概述这个部分
我们来看这里有四组不同的数据
每组数据有两个变量
从数据分析的结果来看
这四组数据具有相同的线性回归表达式
也具有相同的相关系数
可是我们如果用图形来表示这些数据
我们可以看出
这四组数据具有明显不同的特点
这就是由著名的统计学家
安斯科姆绘制的数据可视化的经典案例
安斯科姆四重奏
这个案例说明了什么问题呢
说明了数据可视化
可以直观展示数据的真实情况
减少数据分析的失误
数据可视化
也就是Data Visualization
指的是将数据和信息
转换成为各种可视化对象
使得信息沟通更加清晰便利的一系列的技术
眼睛是我们人类最重要的感觉器官
从外界获取的各种信息
主要都是通过视觉来感知的
而且人们通过视觉接收信息的速度
比其他器官接收信息的速度
快了十到一百倍
在信息时代
人类社会的各种活动
每一天都产生海量的数据
如何快速高效地处理这些海量的数据
就是一个非常重要的研究方向
如果将包含大量数据的信息
压缩到设计精美的可视化图形之中
就可以大大提高信息认知的效率
接下来
我们要介绍一个非常著名的可视化实例
1854年 英国伦敦爆发了严重的霍乱疫情
英国医生John Snow
开始着手调查研究霍乱传播流行的途径
他绘制了一张特别的地图
也就是这一幅
疫情分布的情况图
那么他是如何绘制的呢
我们把这副地图放大来看一看
在这幅地图上面我们可以看到
这个医生他把每一个病例
用一个短的线条表示
每一个水泵
也就是饮用水的水源地
用一个圆点来表示
那么我们可以从这个图中看出
在这条Borad Street这条街道的附近
有一个水泵
这个水泵周边的病例的数量
明显多于其他地区
也比其它水泵周边的病例更多
后来人们关闭了
Borad Street这个街道的水泵
不再使用这一个饮用水的水源
周边地区的疫情就逐渐减轻了
这是一个非常经典的案例
我们来看
Edward Tufte是耶鲁大学教授
也是一位信息设计领域的先驱者
他在
The Visual Display of Quantitative Information
这本书中指出
完美的数据可视化
必须包含以下要素
首先要在一个小的空间
来展示众多的数据
那么这些数据要能够引导受众
来思考问题的实质
比较不同的数据
有什么区别有什么关联
而且还要注意避免歪曲所要表达的数据
也就是说我们要选择一个合适的
可视化的模式来展示这个数据
不要误导观众
会误解我们要展示的数据
这是非常重要的
而且我们还要从多个不同层次
来展示数据的细节
那么我们要做数据可视化
还要有明确的目的
我是为了展示数据
还是为了做一些研究做一些探索
还是有其它的目的呢
那么最后一点
我们的数据可视化
还要与数据集的数据说明
以及语言描述紧密结合
也就是说我们要说明一下
数据可视化的这幅图片里面
用到的数据来自于什么地方
还要用一些恰当的语言
来做一些描述和说明
这也就是Edward Tufte提出来的
数据可视化的一些基本的要素
那么接下来我们要给大家介绍的
是gapminder这个网站的
一幅非常棒的可视化的实例
这幅图片它使用的数据
是2015年世界上182个国家和地区
人民的人均GDP和预期寿命的数据
我们可以看出来
在这幅图片上
首先我们来看一下横坐标
横坐标表示的是人均GDP
从一千美元两千美元
一直到更多的六万多美元
那么纵坐标表示的是预期寿命
从六十岁七十岁到八十岁
每个国家用一个圆形气泡表示
那么这个国家和地区的人口越多
那么他的气泡就越大
而且气泡的颜色
是用来表示这个国家和地区在什么地方
那么如果来自于亚洲
我们用红色来表示
如果来自于欧洲
我们用黄色来表示
那么我们也可以看出
在这幅图片里边
气泡最大的两个国家是
我们中国和印度
这个图片就是一个非常完美的可视化的实例
而且它包含的信息量很大
而且表示的是一个非常多维的数据
那么我们从计算机学科的角度出发
大数据的数据类型可以分为两种类型
分别是结构化数据和非结构化数据
结构化数据指的是
可以用二维表的结构
来逻辑表达和实现的数据
它遵循一定的数据格式与长度规范
主要我们可以用关系型数据库
来存储和管理
而非结构化数据
它的特点是数据结构不规则或不完整
没有预定义的数据类型
是不方便用二维表结构
来表现的数据
那么非结构化数据也有很多类型
包括了文本 图片 音频和视频信息等等
那么要处理这些多种多样不同类型的数据
有哪一些常用的可视化工具呢
我们给大家做一个归纳
首先我们可以使用主流软件供应商的
数据分析处理的软件
例如IBM的Watson Analytics
还有SAS统计分析软件
也可以使用专业的数据可视化应用软件
例如Tableau
就是一家专门致力于
交互式数据可视化领域的软件公司
他的一系列数据可视化工具
在智能商业的领域
具有非常广泛的应用
还有一些开源工具可以使用
R语言大家都知道是一个免费的
也是非常著名的统计分析软件
R语言中的一些软件包
可以绘制各种各样的图表
D3.js是一种脚本库
可以将数据转换成为各种可视化元素
展现在网页之中
那么还有一些
是面向一种特定应用的设计软件
例如有很多专门制作数据地图的软件
例如Leaflet
我们制作可视化图片
还可以使用在线设计网站
直接在网站上操作
上传数据 分析处理
就可以在线生成各种图形
包括我们有一些专门制作词云的网站
还有我们国内有很多
制作各种可视化图片的网站
包括图表秀网站等等
对于初学者来说
也可以使用一些简单易用的
可视化应用软件
例如微软公司的Power BI
可以下载到本地计算机
安装使用都非常方便
还有就是入门级的应用软件
就像Excel这样的工具
有很多类似于Excel这样的工具
可以设计制作简单的可视化图形
我们今天的这一讲就讲到这里
谢谢大家
-1.0我国古代对健康信息学的智慧贡献
-1.1新一代信息技术在人类健康管理中的应用
-1.2健康信息学迎来发展机遇
--Video
-1.3人类智能技术AI在中医药领域的应用
--Video
-章节测试
--外部链接
-第一章 导论--章节测试
-2.1中医师如何利用健康信息治病(一)
-2.2中医师如何利用健康信息治病(二)
-2.3健康信息在中医养生中的应用(一)
-2.4健康信息在中医养生中的应用(二)
-2.5中医望诊在收集健康信息中的应用
-2.6中医舌诊在收集健康信息中应用
-2.7中医问诊在收集健康信息应用
-2.8中医脉诊在收集健康信息中应用
-2.9粪便分析在收集健康信息中的应用
-第二章 中医四诊的健康信息分析与应用--章节测试
-3.1云计算时代对人类健康管理的意义
-3.2大数据时代对人类健康管理的意义
-3.3健康信息的大数据及云平台的发展现状(一)
-3.4健康信息的大数据及云平台的发展现状(二)
-3.5移动健康医疗APP的主要分类及设计原则
-3.6移动医疗的可穿戴设备技术发展
-3.7移动医疗的可穿戴设备技术及其应用案例(一)
-3.8移动医疗的可穿戴设备技术及其应用案例(二)
-章节测试--作业
-4.1健康信息可视化概述
-4.2可视化实例1
-4.3可视化实例2
-4.4可视化实例3
-第四章 健康信息学的可视化技术--章节测试
-5.1证素辨证原理研究
-5.2中医证素辨证原理1
-5.3中医证素辨证原理2
-5.4基于证素辨证原理的中医健康管理系统 编辑
-5.5中医健康相关数据的分析与知识发现
-5.6健康危险因素评估1
-5.7健康危险因素评估2
-章节测试--作业
-6.1基因健康信息学的原理及人类基因相关知识
-6.2基因检测技术及其意义
-6.3人体第二健康信息基因组——人体肠道菌群
-6.4肠道菌群的相关信息与人的关系——互利共生
-6.5中医药诊疗过程中肠道菌群的变化信息
-章节测试--作业