当前课程知识点:大数据技术与应用 > 杨保华:区块链与数据科学 > 区块链的应用和总结 > 区块链的应用和总结
那刚才我讲了说
在数据和区块链
两者有很多的这种
很好的合作的场景
区块链在解决
数据的产生的真实性
交换过程中的安全性
以及最后体现它的价值方面
都有很多很好的这个方法
那我们最后我们来看一下
那区块链它有些
相关的一些开源项目
那实际上区块链
它有很多种分类的方法
那现在大家用的
最常见的分类方法
一般是把它分为所谓公有链
还有联盟链
以及其他相关的项目
那么公有链
它有时候也称为说是
不带权限的这个网络
它一般面向公众
所有人都可以自由的参与
类比现在的这个公共的互联网
所有人都可以接入
那么同时它对于用户
其实并没有很强的身份的要求
它是匿名化或者是化名化的
很多时候它的场景并不可信
那么两个典型的项目
包括像比特币 以太坊
这两个很大的这个开源项目
联盟链
那它是所谓的带授权的
这样一个网络
它面向的应用场景
跟公有链不太一样
它面向企业
所以一般来说只有联盟中的成员
可以参与到这个网络中
就像我们的企业网络一样
同时因为它是带权限管理的
所以参与网络中的个体
往往需要一定的身份
我们会有一定的访问权限控制
这样的一个机制
加入到网络中的个体
因为他们带有身份
所以存在了一定的
信任的一个前提
典型的代表性的开源项目
是超级帐本项目
其他的项目包括像IPFS
Ripple R3 Corda等等
也都是很有趣的
跟区块链相关的项目
那我们首先来看一下
这个比特币
那么比特币我们定位它为
前人肩膀上的集大成者
它的白皮书
是在2008年10月份提出的
但是我们回过头来来看
比特币中的很多的设计
在之前已经被很多人提出
并且探索过
最早在1983年David Chaum
他提出了e-Cash
并且他把它这个
跟当地的一些银行进行了适用
但是e-Cash它本质上
它虽然能够支撑
这种小额的交易
它本质上它还是一个
中心化的一个机制
所以最终这个项目也失败了
1997年Adam Back
提出了这个HashCash
这样一个设计
那当时主要是用来
想解决垃圾邮件
还有垃圾的博客评论
这样的一个问题
那么他的思想跟后来比特币里面
大量用的POW思想
实际上是一致的
1998年 Wei Dai
他提出了所谓的这个
B-money的一个设计
B-money也是有一个
很短的一个白皮书一个文档
那如果我们去看那个文档的话
你会发现说B-money
它的整个的设计思路
实际上跟后来的这个比特币项目
应该说非常相似
除了一点就是说
因为1998年那时候
还没有P2P网络
所以在网络层的设计上稍有欠缺
但遗憾的是呢
B-money的设计
最后也只是有一个白皮书
没有正式的最终实现
那么我们知道到后来
P2P网络开始兴起对吧
1999年到2005年
是P2P最热门的时候
那时候有很多的研究的话题
那么到了2009年比特币
在站在这么多前人成果基础之上
化名中本聪的这样一个人
或者一个团队
他提出了比特币
P2P e-cash
这样一个白皮书
那么比特币上线之后
成功运行了很多很多年
但是慢慢的它也体现出
它的一些缺陷
包括它的性能比较差
它的这个使用过程中
它的匿名可能不够强等等
这样一些问题
那么比特币的
一些核心的一些开发者
针对比特币的一个缺陷
后来在2015年
也正式退出了以太坊
这样一个公有链项目
那么以太坊迄今为止
应该说是全球范围内
最大的公有链的一个项目
它的目标也是改善比特币
这样一个帐本的一个不足
它也是来作这个
去中心化的一个货币还有应用
提供了很多种不同语言的
一个客户端
那我们总结以太坊
基于比特币的主要的创新点
实际上在于这么三点
其中第一点
也是最重要的一点
是它引入了智能合约
这样一个机制
那我们知道说在比特币里面
虽然也有比较简单的
这样一个脚本机制
但是它并不是图灵完备的
这个就直接制约了
它能做的事情相当有限
第二点以太坊
改善了处理的性能
它将叔块的时间
从原来我们讲大概10分钟一个块
提升到了15秒左右
第三点它引入了一些
新型的一些哈希算法
数块激励
包括后来探索的新型的
这个共识机制等等
它又提高了网络的安全性
同时2017年
以太坊社区也看到说
在企业应用场景下
有一些不同的一些需求
也成立了企业以太坊联盟
在2018年10月EEA
与超级帐本还宣布合作
共同探索在企业场景中的
一些应用
在这里有必要跟大家再强调一下
这个智能合约
智能合约它并不是一个新鲜事物
如果从它提出算起
1994年Nick Szabo
最早提出这样一个智能合约
他当时的设计是说
我们可以把现实生活中的
这些合同 对吧
相关的这些商业上的一些
最佳的一些规范等等
我想把它电子化
一旦电子化了之后
那所有人就确保说
这个智能合约的执行
那肯定是自动化运行的
没有人能去篡改它对不对
那它会极大的提高
大家这个利用合约
来协同的这种效率
但是遗憾的是
这个1994年提出之后
很长一段时间里
一直解决不了一个
很大的一个问题
就是说智能合约本身是可信了
但是它运行在什么地方
你把它放在哪样的一个
可信的环境中
因为我们知道
说这个无论是计算机还是互联网
都有很多的安全的风险
比如说你放在某个计算机上
计算机可能会被黑客攻击
黑客可能会替换里面的智能合约
所以很长一段时间
智能合约那只是一个设想
直到后来这个
我们有了分布式帐本技术
我们可以提供一个
可信的运行智能合约的
这样一个环境
智能合约才能大放异彩
另外一个项目是超级帐本项目
超级帐本项目
目前来看是全球范围内最大的
面向企业应用场景的
企业级的分布式帐本
那它正式的创立是在2016年初
那在创立之初
包括30家来自金融 科技等
行业的领军的这个企业
包括像IBM 思科 Intel
J.P. Morgan等等这些企业
那么它由旗舰的基金会组织
Linux基金会来支持
遵循了商业友好的
Apache v2 的 licence
这也是为什么现在大量的
面向企业的区块链
分布式帐本的系统
都是基于超级帐本的技术来构建
因为它的Linux是商业友好的
那么从创立之初开始
经历到现在大概3年的时间
它的成长是飞速的
到目前为止全球范围内
我们已经有接近
300家企业的会员
包括十大顶级项目
数百位活跃开发者
还有大量的代码的提交等等等等
那么超级帐本项目
它跟之前的比特币
以太坊项目不同
它面向的是企业的应用场景
所以它重点考虑了
企业的一些需求
包括性能的保障
安全可控 可扩展性
还有代码实现的可插拔性等等
那这些特性都使得
超级帐本项目本身
可以发展的非常快
同时它可以支持
多种复杂的应用场景
那么超级帐本项目
它目前里面包括十个顶级的项目
它们采用不同的编程语言开发
使用了大量的这个开源的生态
开源的工具
除了Fabric Sawtooth
Iroha Burrow
这四个是作为框架项目
Cello作为部署
和管理运营的项目
Explorer Composer
作为面向合约开发者的
应用的项目
还有一个Indy
它作为分布式身份机制的
探索的项目
还有这个Callper
是作为性能评测的项目
还有Quilt来探索跨链的机制
从这些项目中大家可以看出
整个超级帐本的这个社区生态
是非常完备的
这多个项目互相配合
可以让大家
可以很快的使用超级帐本的技术
来构建基于分布式帐本技术的
这样的平台
此外超级帐本项目
对整个分布式帐本领域
它的有很多的贡献
其中很重要的一个贡献
那就是它提出的这个
分布式帐本平台的
一个参考架构
在超级帐本来分
它将整个的这个帐本平台
分为四层
从最底下的分布式帐本
到上面的智能合约
再到上面的这个身份管理机制
再到最上面的
面向客户端的这个SDK
还有API 这个参考架构
现在也被很多其他的项目所借鉴
我们来总结一下
开源的帐本项目
从比特币到以太坊到超级帐本
那么比特币它面向的
还是加密的数字货币
它是公有链
吞吐量典型的是小于10
交易延迟分钟级
不支持智能合约
PoW能源密集型的共识机制
同时它只支持所谓的单帐本
没有隐私保护的机制
同时它不支持
很友好的这个升级操作
但是它作为首个
大规模的加密货币的项目
它的意义也是非常重要的
以太坊在比特币的基础之上
改善了比特币的性能
我们可以做到
十到百这个量级的吞吐量
交易延迟可以减少到10秒级
支持智能合约
同时支持多种的共识机制
但是以太坊本身
它也是单帐本的一个机制
不保护隐私
同时也存在着一个分叉的风险
所以以太坊它是一个最大的
这个大规模的公有的
智能合约的一个引擎
超级帐本项目面向企业的应用
所以它定位是一个联盟链
那它的性能可以很容易的做到千
甚至万 甚至更高
交易延迟可以做到秒级
支持主流的编程语言
来实现智能合约
同时支持可插拔的
这样一个共识机制
而且它的帐本类型是
多种帐本 支持多帐本
有一些额外的隐私保护的机制
包括SideDB 还有idemix等等
同时在升级操作上
目前是一个平滑升级的
这样一个支持
它是作为首个
面向企业的这样分布式帐本
目前也是最大的
开源的分布式帐本项目
最后一个项目
我们来看一下这个IPFS
它作为这星际文件系统
最早是2014年
由Juan Benet发明
目前是由他这个团队
所成立的公司
Protocol Lab来维护
作为星际文件系统
它的设计初衷
是为了实现一个
是要取代现在的这个Web的网络
是要实现一个
真正的一个分布式的Web
那么它有两个特点
一个它是一个
点对点的一个存储网络
P2P的存储网络
那这点跟之前的
很多P2P的网络类似
再一个它支持这个
所谓的超媒体的一个协议
那IPFS它之所以要提出
其实主要还是要解决
现代Web网络里面不够安全
和效率低下的这样一个问题
我们知道HTTP的1.0协议
是从1996年提出的
此后虽然打过很多次的补丁
但是主体内容并没有得到改善
所以它数据交换过程中
存在着很多的问题 不够安全
传输的效率也比较低下
那IPFS同时它也很有意思
它跟之前的P2P网络
有一点很不一样的一个地方
就是它引入了一个
有效的激励机制
通过它独有的这个Filecoin
来激励更多的节点
加入到这个网络中
那么它的工作原理也非常简单
那对于任何的这个数据来讲
它也是利用了数字摘要
我再次强调数字摘要非常重要
在IPFS中你看它也用了
数字摘要技术
它用数字摘要来作为
这个数据的索引
在网络中用节点
用分布式的方式
来存储这些索引还有数据
那这就意味着用户在使用中
如果我知道这个索引值的话
我可以很好的
马上就很快的能够
定位到最终的这样一个数据
那我们知道说索引值
一串随机数
这个谁记得住对吧
那它也提供了IPNS
这样一个域名机制
能够提供比较友好的一个
命名的一个解析
那从我刚才的讲解中
大家可以看到说
IPFS和区块链什么关系
两者实际上有非常好的
一个互补的一个关系
因为我们知道说
在区块链的系统中
往往是我们不适合用来存储
大量的一个数据
所以我们可以用IPFS
来存储原始的数据
节约链上的存储
同时我们在区块链中
利用对数据的这个索引
来真实记录这个数据的一个操作
当然虽然我们已经有了
这些开源项目
还有很多基于这些
开源项目的方案
和应用的案例
那在区块链还有这个数据科学中
其实还有很多
其他需要探索的问题
这里面我觉得可能比较重要的
有四个方面
第一个是更完备的一个安全性
我们在动态的一个场景下
怎么实现更细粒度的一个控制
再一个是可扩展性
这里的可扩展性
是讲的是在互联网尺度上
也就是一个极大规模的情况下
而且是海量数据
那现在可能无法想象到
这样一个数据量下
我怎么能够保证
我系统的这个性能表现
另外一点很重要的
要强调这个互操作性
如果你设计出一套方案来
与已有的任何其他的系统和方案
不能很好的进行互联
那这样一个方案
它的落地成本也是非常高的
所以我们需要考虑到
互操作的实践性
最后规范化 标准化
这些都在互联网的
这个成长过程中
起到了很重要的作用
那么规范化和标准化
它需要科研界 学术界 企业界
还有开源界一起通力合作
最后我们来总结一下
那这节课里面
我们一起剖析了数据的产生
交换 还有价值
在不同环节中的一些关键问题
以及区块链在这些环节中
怎么能够去缓解这些问题
那区块链它可以很好的提供
信任的基础
最终实现数据的价值
它能够保证数据
产生过程中的真实性
能够保护数据
交换过程中的安全性
同时最终实现数据价值
那我想无论是数据科学
还是区块链的这个科技
那其实从它的成长的过往来看
仍然是属于比较年轻的学科
还存在着大量的机遇和挑战
那未来信息科技领域
更需要的应该是具备这种
跨学科能力的
这种系统性的综合性人才
那我也希望大家能够
通过努力的学习
能够掌握和培养这样的能力
这节课程就到这里
好的 谢谢大家
-完整讲座
--完整讲座
-李国杰:面向大数据的数据科学--课后习题
-数据思维方式的改变
-数据的假设与采集
--数据的假设与采集
-数据的准备
--数据的准备
-数据的分析
--数据的分析
-数据的解释与验证
--数据的解释与验证
-吴甘沙:大数据分析师的卓越之道——课后习题
-个人介绍
--个人介绍
-硅谷热门公司
--硅谷热门公司
-大数据简介
--大数据简介
-大数据平台系统
--大数据平台系统
-工业实践
--工业实践
-结尾
--结尾
-董飞:硅谷公司的大数据实战分析--课后习题
-数据系统架构历史
--数据系统架构历史
-从sql到nosql
-数据库系统实现变革
-负载融合
--负载融合
-数据系统架构成本
--数据系统架构成本
-杨光信:数据系统架构——课后习题
-什么是可视化
--什么是可视化
-网络可视化
--网络可视化
-大数据带来的新挑战
-大数据网络可视化的若干案例
-时磊:大数据网络可视化—— 课后习题
-网络安全概述
--网络安全概述
-大数据安全分析平台
-大数据安全应用
--大数据安全应用
-大数据平台安全
--大数据平台安全
-彭元:网络安全与大数据——课后习题
-人工智能系统的本质功能模型
-隐性智慧,显性智慧
-人工智能:能与不能
-人工智能的技术现状
-机制主义人工智能模型
-信息转换和智能创生定律
-人工智能与大数据
--人工智能与大数据
-钟义信:“人工智能与大数据”的创新研究——课后习题
-什么是机器智能
--什么是机器智能
-大数据的重要性及特点
-大数据中的因果关系与关键技术
-大数据与机器智能
--大数据与机器智能
-大数据思维
--大数据思维
-讲座问答环节
--讲座问答环节
-吴军:数据为王和机器智能的时代——课后习题
-大数据概述
--大数据概述
-大数据相关新趋势
--大数据相关新趋势
-大数据技术创新1
--大数据技术创新1
-大数据技术创新2
--大数据技术创新2
-大数据技术创新3
--大数据技术创新3
-大数据商业价值和前景
-大数据机遇和挑战
--大数据机遇和挑战
-苏中:从大数据到认知计算——课后习题
-金融大数据概述
--金融大数据概述
-用户个人信息分类
--用户个人信息分类
-金融大数据法律框架
-实际案例和业界实践
-核心风险点
--核心风险点
-王新锐:金融大数据的法律实践——课后习题
-互联网与商业化
--互联网与商业化
-大数据与计算广告
--大数据与计算广告
-计算广告介绍
--计算广告介绍
-数据交易
--数据交易
-刘鹏:互联网变现与计算广告——课后习题
-从记账技术到区块链
-区块链确保数据真实性
-区块链确保数据安全性
-区块链衡量数据价值
-区块链的应用和总结
-杨保华:区块链与数据科学——课后习题
-个性化推荐系统
--个性化推荐系统
-推荐系统的召回与排序
-智能制作之个性化海报
-线上推荐系统其它要素
-杨紫陌:个性化内容推荐——课后习题
-个人介绍及用户理解背景
-用户理解与用户画像
-案例1:用户属性识别
-案例2:自然人识别
-案例3:WOI与社交关系识别
-陆祁:用户行为大数据——课后习题
-内容智能生态——数据、算法、应用
-大数据在内容分析的应用
-IP价值评估系统
--IP价值评估系统
-爱奇艺的剧本评估
--爱奇艺的剧本评估
-爱奇艺的智能评分
--爱奇艺的智能评分
-阳任科:大数据与AI的内容分析——课后习题
-外卖行业及场景简介
-餐饮及外卖行业大数据应用框架
-案例分析:智能营销场景的用户画像
-案例分析:智能助手场景的菜品画像
-王栋:美团外卖的大数据应用——课后习题
-旅行业务的特点
--旅行业务的特点
-美团旅行业务的用户画像构建
-用户画像的应用案例
-住宿需求预测问题
--住宿需求预测问题
-营销补贴策略建模
--营销补贴策略建模
-赵楠:商业思维与大数据技术在美团旅行业务中的结合——课后习题
-互联网金融背景介绍
-互联网金融科技
--互联网金融科技
-数据智能的三个案例
-技术展望
--技术展望
-陈彧:美团点评金融服务的大数据与人工智能——课后习题
-数据的进化历程
--数据的进化历程
-阿里DMP平台介绍
-核心技术及案例
--核心技术及案例
-数据应用
--数据应用
-毛波:阿里全息大数据构建与应用——课后习题
-在线营销
--在线营销
-竞价机制
--竞价机制
-数据价值
--数据价值
-韩定一:在线营销中的竞价机制与数据价值——课后习题
-竞价排名搜索
--竞价排名搜索
-主要技术问题
--主要技术问题
-点击率预测概述
--点击率预测概述
-点击率预测实践
--点击率预测实践
-龚笔宏:大数据在工业界中的经典案例分享——课后习题
-即时配送业务的背景及挑战
-案例1:订单分配策略
-案例2:供需平衡策略
-未来展望
--未来展望
-郝井华:即时配送中的人工智能——课后习题
-什么是数据驱动营销
-LTV留存分析
--LTV留存分析
-RFM会员体系
--RFM会员体系
-消费者微群画像
--消费者微群画像
-渠道倾向性分析及行业竞争分析
-机器学习潜客挖掘模型
-- 机器学习潜客挖掘模型
-陈辉:数据驱动营销——课后习题
-金融大数据时代
--金融大数据时代
-大数据客观信用
--大数据客观信用
-我国的金融环境
--我国的金融环境
-客观信用的实践
--客观信用的实践
-应用案例与成果
--应用案例与成果
-艾小缤:大数据评价体系在金融、征信领域的创新——课后习题
-外部链接
--外部链接