当前课程知识点:健康信息学 > 第三章 健康信息与健康大数据 > 3.4健康信息的大数据及云平台的发展现状(二) > 3.4健康信息的大数据及云平台的发展现状(二)
同学们好
下面我们开始介绍
健康云平台
和大数据的相关的技术架构的
第二部分
这张图的话
有几个关键性的一个分析
一个就是开放性
那么开放性的话主要是
医疗云平台要面向不同的主体
将服务分装成一系列的数据接口
在API
通过采用开放的授权技术
供第三方应用开发者
使用平台本身的一些资源
并提供统一的数据灵活接入
和安全调用的能力
促使的用户和患者
与医务人员和医疗机构之间
进行服务的提供
和安全可靠的一个交互
第二个的话就是可扩展性
我们知道的话
这可扩展性的方面
不仅是采用消息中间件实现平台之间
与外部系统交互的一个
高内聚或者低偶合的一个设计思想
而且的话在接口设计上的话
也兼容国内外标准
标准组织或者行业
通用的一个标准化协议
或者规范
为后续这个平台在运营过程中
不断演化提供一个有力的支撑
第三个的话就是
高并发
与负载均衡
所谓的话高并发的话
只指在线高峰期
服务器收到的高负荷访问
或者大量的并发请求
一般会造成影响时间长
数据易丢包或者是传输延迟
负载的这个均衡
是高并发特性的一个最佳决策方案
简而言之就是把
任务分摊到多个操作单元进行操作
如微博服务器
ftp服务器
企业关键应用服务器
和其他服务器等
从而共同的话了完成
工作任务
负载的均衡有四类
一个是软硬件负载均衡
一个是本地和全局的负载均衡
第四个就是
高可用性
就是通过尽量缩短日常的维护操作
和突发的系统崩溃
而导致的停机的时间
以提高系统或者应用的可运性
第五个就是高性能性
就高性能性
直接体现在用户在使用系统服务的过程中
感受到良好的且快捷的一个体验
那么这个图的话
就是平台云化解决方案
就是
云平台的一个解决方案
在医疗云平台的
它第一个的话就是云计算能力
医疗云平台
既要存储或者管理机构化的数据
又要面对半结构化和非结构的数据
因此
还都不成为一个构建云平台一个首选
那么都不是一个分布式的一个基础架构
用户可以在
不了解分布式底层细节的基础上的话
可以充分利用
集群的威力
进行高速运行或者存储
开发分布式的应用程序
那么都会有几个特点
一个是
高可扩展能力
一个是成本低
第三个效率高
第四个是可靠性高
再一个的话就是
数据的整合能力
在很多的之前的话
医疗数据往往存储在Oracle或者MySQL
或者其他的关系型数据库
或者非关系型数据库中
那么医疗平台的云化的话
首先面临的问题就是历史离线数据
这些数据的话
像很多分布式的一个文件系统
它的数据迁移的话
数据转换或者迁移的过程大致可以分为
抽取转换和装载三个步骤
那么数据的抽取转换
是根据旧系统
新旧系统的数据库的映射关系进行的
其中包括
对数据的差异性分析
转换步骤一般还包含了
数据的清洗过程
主要是针对原数据库出现的
包括恶意性
重复
不完整
违反业务等问题
数据进行一个相应的清洗操作
在清洗之前的话
需要进行一个数据质量的分析
找出可能存在的一些问题
数据装载的话
是通过装载工具或者自行编写的
这个程序的话
进行抽取
转换后加载到目标数据库当中
第三个的话就是分布式的存储能力
分布式存储能力的话
是一个可扩展的
是一个大数据仓库
这Hbase建立在一个mapReduce这个框架之上
利用这个HDFS的这个分布式的处理模式
融合的Tvalue这个存储模式
实现实时的查询能力
并通过mapReduce的这个实现
离线处理或者批处理
因而的话让用户
在大量的数据查询记录
并获得综合的分析报告
他这个Hbase的定义的话
有四个四维的数据模型
包括行见列举列修式符合版本
第四个的话就是分布式的离线处理能力
那哈托波尔设计的一个自身的核心构建
那么mapReduce对海量的数据
实行并行的计算
可以把工作流分布到大量的机器中
及通过对数据集的大规模的操作
分发给网络上的每个节点
实现可靠计算
每个节点的话将周期性地返回到
完成的工作量和最新的工作状态
那么在
医疗云分步计算中提供
包括数据集的划分
和计算
任务的调度
数据
还包括一些系统的优化等
接下来的话主要介绍
实时流处理能力
为了满足在线或者境线海量数据处理的需要
平台需要在很短的时间
完成时效性很强的一个数据处理任务
为此的话
医疗云平台
可能会引入上网的实时的计算系统
支持流式计算
批处理或者适时查询
那Storm只是一个分布式的
一个容错的实时的计算系统
他可以的话
方便的
在一个计算机群里面
编写成与扩展性
复杂性是实时计算
每秒可以处理数以百万计的一个消息
保证每个消息的话
都能够得到实时的一个处理
而且的话这个的话
可以支持开发人员用多种
编程语言进行开发
保证每一个消息的话能够
及时的处理
在任务失败时的话
要负责从消息源
重试消息
具有很好的一个容错性
第六的话就是内存计算能力
那么这个部分的话
是个医疗云平台
集成一个Spar内存计算这个集群
实现快速的数据分析
第三的话就是
数据安全和用户的隐私解决方案
从这个数据传输的角度来说
数据安全与用户的隐私
解决方案涉及到平台的数据加密
密钥的管理和隐私保护等多个环节
在数据的加密的话
是因为健康和医疗数据涉及的隐私
并与诊疗院要保险都有很大的关系
所以在医疗信息中必须要通过数据加密
来实现
对于大的信息系统而言
加密过程主要分为
一级加密或者二级加密
第二个的话就是
密钥管理的话
大的信息系统所需要
密钥种类和数量都很多
根据密钥的资质和重要性
把密钥化成几个级别
不同的级别的密钥可以分开存放
最好是异地或者异设备
秘钥的更新的话
如果系统
你使用的固定或者单一的必要的话
那么
足够多的数据传输或者存储操作
就有可能降低的
它的安全性
所以的话秘钥需要定期更新
或者的话不同的应用或者业务
需要不同的密钥
隐私保护的话
这个相关条例
就是主要是为了
做好医疗数据安全和隐私保护
需要首先明确政府和监管体系
在安全或者隐私保护上的作用
更好的建立健康医疗信息的市场
这里面主要包括几个方面
一个是隐私条例涉及到
个人健康信息的时候的话
要规定个人
可以了解或者控制自己的信息
如何被利用或者披露
医疗保健服务的提供者
无论规模大小
只要涉及到
健康信息的电子记录
都必须要遵从
健康信息保护还包括有两种
一种是
可以识别个人身份的健康信息
包括个人的基本数据
如身体或者精神健康状况
针对个人的医疗措施
医疗支付情况
第二个的话就是可识别
个人的
或者是通过合理推断
可以识别个人的身份信息
或者的话是通过身份识别信息
如姓名
地址 出生日期 社会保障
这些都属于隐私保护里面的相关内容
那么这张图的话
主要是介绍
健康医疗大数据的
一个架构的设计的一个要素
这个部分的话主要是
这么四大块
从这个图上来看的话
就是
一个就是
多元异构大数据的一个抽取和整合
多元异构数据的有效整合
是大数据分析和挖掘的一个前提
健康的一个大数据的话
主要是通过互联网+
应用中各类的可穿戴设备产生的
多模态的一个体征数据
情景数据
电子健康档案
以及网络空间
社交媒体相关的数据
医疗大数据的话
主要是从医院内部的
包括HIS
LIS
PACS各类医疗数据
另外还有一些其他类的
公共卫生数据
基因组学数据
还有这些多元化的一些数据
通过整合
取得获得一些元数据
或者规划的一些信息
数据整合的引擎
一般处理还包括
与外部的外部源
Source系统相连
解析输入文件
已识别元数据的格式
将其的话语存储的元数据映射表的
一些元数据格式进行一个语义的匹配
对输入的这个进行分割以及利用
并行机制汇总到这个数据的话
转化成一个目标系统
进行了数据格式
最后的话连接是目标系统
将其写入
或者存储
第二个部分的话就是
海量的数据存储
统一的存储
海量数据的话
统一存储是大数据分析的一个基础
以用户或者患者为中心的
设计的海量数据存储的话
这个模型
围绕着用户的健康档案
按照统一的格式
或者规范来实现的
他面临的话有几个挑战
一个是支持
对前述各类数据的一个增加
删除 查询或者修改
以保证这些操作有一个可靠性和一致性
第二个的话
随着电子病历或者影像
或者通讯的Parcs系统的用户量
和数据量的一个飞速增长
在数据的存储规模
达到一定程度的时候的话
要让它能够实现
存储量的自动的增长或者负载平衡
第三的话就是
分布式并行数据处理
高效的分布式的并行数据处理的话
是大数据的一个关键技术
为了支撑
各类复杂多样的大数据应用场景的话
需要频繁对这些繁杂的大规模的结构化的
或者非结构化的数据进行处理
实现这些
数据的高效分布并行处理
是非常关键的
第四个健康医疗大数据的
分析和存储
这个部分的话
是从海量的多元的异构数据中
挖掘发现知识和获取
所关注的问题的一些
新的见解和解决方案
以实现数据资源的巨大潜力
和它的价值
给数据拥有者或者其他利益相关方
带来更好的帮助
再一个方面的话就是要基于
患者健康医护过程的大量门诊和临床数据
针对特定的专业需求和应用场景
可以构建复杂的计算模型和学习算法
实现相应的大数据的分析
服务引擎
如
患病的风险预测
慢性病的发展趋势的分析
关键致病因素的发现
来协同推进和多维数据可视化的处理
另一个方面的话
要结合医疗机构综合管理
公共卫生或者疫情的管理
信息共享和交换
以及其他卫生主题等业务需求
对各类医疗
业务进行一个汇总统计构成分析
对比分析 因素分析等等
通过各种表单
或者图表
能够直观的
可视化的能够体现
它的一些价值
能够支撑系统
进行一些决策和服务
从这张图我们可以看出的话
四个方面
一个就是健康促进 量化自我
洞察自身
改善行为
健康促进
其实我们前面说了很多了
健康促进是通过这个佩戴
或者多个或者复合式的一个可穿戴设备
对个人的日常生活进行一些跟踪
运动 睡眠等等
实现身体的
健康体征的自我量化
随着技术的不断进步
各种的智能穿戴设备
也是层出不穷的
我们要通过这种
大量的生理指标的数据源
进行一些收集和分析
能够帮助或者辅助患者的话
对日后的一些康复
提供一些更多的一些知识
第二个的话就是
慢性病的管理
慢性病的管理的话
要做到这种预防疾病和风险控制
大家知道的话
疾病预防主要是通过大量的病例
或者是相关的人口统计学的数据挖掘和分析
总结出致病的因素
并根据健康人群的健康档案的信息评估
患者的一些风险
知道患者的趋避利害
降低患病的几率
那么健康大数据的话
可以分析患病或者各种因素的相关性
找出关键风险因子
第三个的话就是
诊断治疗
主要就是从
智能临床决策支持或者信息挖掘
对患者病情严重程度的情况的话
能够实施评估 预测
有助于的话
临床医务人员快速的确定
患者或者病人这种状态
及时的制定 治疗或者护理计划
通过大量的患者多模态的生理数据的分析
可以提高
对患者病情的严重程度进行一个评估
更好的预测病情的发展趋势
使医院院内的医护流程
更加顺畅或者更加有效
第四个部分就是医院外的康复
就是远程监护或者改善患者的生活质量
患者出院之后的话
可以通过一些设备的话
对患者的一些信息进行一些控制
当然
很遗憾的话
有近1/5的病人在出院之后30天有可能会
再次入院
造成的医疗资源浪费
在其中70%的病人的话
再住院本来是可以避免的
那我们可以通过大数据的话
可以发现患者在住院的相关因素
可以进行干预
可以降低再住院的一个比例
第五个的话就是全方位人口的健康分析
健康医疗大数据蕴含着很多的潜在的价值
当这个数据资产
覆盖足够多的人群可积累到一定规模的时候
可以通过大数据挖掘分析
可以实现对人口健康的全方位沟通
预策病情的风险
及时进行干预和家长病房管理
今天的课我们先上到这里
谢谢大家收看
再会
-1.0我国古代对健康信息学的智慧贡献
-1.1新一代信息技术在人类健康管理中的应用
-1.2健康信息学迎来发展机遇
--Video
-1.3人类智能技术AI在中医药领域的应用
--Video
-章节测试
--外部链接
-第一章 导论--章节测试
-2.1中医师如何利用健康信息治病(一)
-2.2中医师如何利用健康信息治病(二)
-2.3健康信息在中医养生中的应用(一)
-2.4健康信息在中医养生中的应用(二)
-2.5中医望诊在收集健康信息中的应用
-2.6中医舌诊在收集健康信息中应用
-2.7中医问诊在收集健康信息应用
-2.8中医脉诊在收集健康信息中应用
-2.9粪便分析在收集健康信息中的应用
-第二章 中医四诊的健康信息分析与应用--章节测试
-3.1云计算时代对人类健康管理的意义
-3.2大数据时代对人类健康管理的意义
-3.3健康信息的大数据及云平台的发展现状(一)
-3.4健康信息的大数据及云平台的发展现状(二)
-3.5移动健康医疗APP的主要分类及设计原则
-3.6移动医疗的可穿戴设备技术发展
-3.7移动医疗的可穿戴设备技术及其应用案例(一)
-3.8移动医疗的可穿戴设备技术及其应用案例(二)
-章节测试--作业
-4.1健康信息可视化概述
-4.2可视化实例1
-4.3可视化实例2
-4.4可视化实例3
-第四章 健康信息学的可视化技术--章节测试
-5.1证素辨证原理研究
-5.2中医证素辨证原理1
-5.3中医证素辨证原理2
-5.4基于证素辨证原理的中医健康管理系统 编辑
-5.5中医健康相关数据的分析与知识发现
-5.6健康危险因素评估1
-5.7健康危险因素评估2
-章节测试--作业
-6.1基因健康信息学的原理及人类基因相关知识
-6.2基因检测技术及其意义
-6.3人体第二健康信息基因组——人体肠道菌群
-6.4肠道菌群的相关信息与人的关系——互利共生
-6.5中医药诊疗过程中肠道菌群的变化信息
-章节测试--作业