当前课程知识点:大数据技术与应用 >  [补充] 艾小缤:大数据评价体系在金融、征信领域的创新 >  金融大数据时代 >  金融大数据时代

返回《大数据技术与应用》慕课在线视频课程列表

金融大数据时代在线视频

下一节:大数据客观信用

返回《大数据技术与应用》慕课在线视频列表

金融大数据时代课程教案、知识点、字幕

好 同学们大家好

我是金电联行的

执行副总裁艾小缤

同时我也是咱们清华大学

机械90级毕业的

这个一个校友

今天我主要是在

大数据评价体系

在金融和征信领域的创新

一些应用

给大家讲一讲

金电联行其实它的总裁董事长

也是范晓忻

也是咱们机械

这个清华大学计算机系

零字班的校友

我们两个这个相识

有一个非常偶然的一个机遇

就是在清华的校友合唱队

所以我们说

无论说做计算机也好

做机械也好

我们再加上一点点

艺术的这个纽带 是吧

能够做到今天跨界

就我们去把大数据

怎么跟金融跟征信对接起来

这个都是有相关的

所以从这点来看

我希望我们在学校的时候

应该开阔眼界

应该去多接触

多发现自己的特长

那么在将来的这个

我们无论说工作也好

创新也好 创业也好

都是会有非常大的帮助的

那么下面我来简单说一下

我们的这个目标

叫做客观信用改变中国

首先来说说大数据

这个概念可能大家都已经

听的非常多非常多了 是吧

我们在今天大家已经认同了

说大数据时代已经来临

那我们什么是大数据时代呢

对吧

大家都看过这个黑客帝国

黑客帝国它描述的一个场景

就是说完全由

虚拟的数字化的世界

组成了一个

大家认为的一个真实的世界

而我们认为大数据

它表达的是一个什么意思呢

是说我们的一个

客观存在的真实的世界

在数据领域的一个投影

那么这些投影在之前

为什么没有体现出来呢

这跟数据的量 多样性 结构

我们最后统称叫数据入口有关系

比如说我们看一个经济个体

对吧

现在的这个无论是个人也好

企业也好

我们发现它的行为

会越来越多的以数据的形式

被记录 被存储 被处理

所以而我们看

我们是逐渐从微观

逐渐走向宏观

我们认为

经济体是个体行为的一个集合

所以从这个角度来看

我们简单的看一下

一个企业 是吧

围绕企业它有采购数据

生产数据 销售数据

那么采购数据里头有原材料

有价格数量

产品有它的主打产品 核心产品

还有它的一些

为了创新去做的一些新产品

包括库存 包括交易

包括银行流水等等的这些

就是现在越来越多的企业行为

都以这个数据的形式被记录下来

包括企业周边 是吧

如果这个企业在一个集团里头

那么它可能相关的这些企业

都有一些数据交换的一些记录

包括再往外是吧 区域

那么跟它这个做生意 有交易的

比如说做批发 做零售

做物流 做金融

都有数据交换

那么再往外 一个环境

我们整存的城市也好

区域也好 甚至整个国家

有很多都是以数据的形式

被记录下来

所以我们说身处大数据时代

它的一个特征

就是我们越来越多的行为

被数据的方式来记录下来

那么大数据

实际上大家各有各的说法

从我们实际这个经验来看

真正应用上的

我们自己感觉的

当然这个可能也是

这个跟大数据的这个理论

相对应的有三块

当然第一叫大容量

这个大家都很容易理解

第二叫多样性

多样性这个概念

就是我们发现就是比如说银行

大家说它的数据量非常大是吧

那么银行的这个信息化程度

也是在国内来说应该是最高的

那么它本身真正能够用于分析的

其实它的多样性不好 对吧

比如它有银行流水

它有交易 这个交易完成

跟银行有关系的这些数据

包括存款行为 贷款行为

这些有数据记录

但是除此之外我们说叫什么

这个更多的叫交易数据

那么还有大量的叫行为数据

没有被记录下来

那么这些行为数据

刚才我已经说了 是吧

反映在各个环节 各个方面

那么多样性就体现在这

所以从这个角度来说

我们无论是银行也好

电信也好 还有政府也好

就是很多个这个公司 企业 机构

有大量的数据

但是在多样性方面

它达不到我们

利用起来的一个要求

多样性什么概念呢

就跟我们说虚拟一个

就比如说我们摄像一样 对吧

可能这是一个机位

但是我们要拍一个3D

那我可能就要很多机位

就是什么

要从不同的角度来看一件事情

那么角度多了 是吧

前面后面 左面右面 上面下面

360度看

你才能对一个物体

比较清晰的去了解它

也许它正面是美丽的

但是它背面

可能就完全是另外一回事

所以多样性

是大数据的另外一个特征

第三个叫快速度

这个为什么要有这个呢

就是我们发现很快 是吧

我们从信息不对称 是吧

然后得到了大量的数据

就走到另外一个极端

叫做信息爆炸

数据量极度的增加 是吧

这个相关的资料大家都能看

大数据的积累是这样一个曲线

我们现在已经到了这个程度

那么在这时候

数据非常庞杂的时候需要什么

就需要我们下一步要谈到的算法

对吧

我们怎么去

叫从纷繁复杂的数据里头

提取出来有价值的东西

那么这个有价值的东西

反映在现实当中

实际应用当中反映在什么

反映在效率上

这个大家去研究一下

比如说这个国外有一些上市公司

是吧

那么有一个做房地产的企业的

那么它这个号称

提前两周能预测某一个人

这是美国的一个

纳斯达克上市的一个企业

大家很容易查

提前两周预测你是不是要搬家

是不是要买房

是不是要请家政服务

是不是要请这个宠物公司

给你宠物做一下打理

它为什么

它预测性是什么

大数据的另外一个特征

为什么能产生预测

预测不是凭空的

不是跟算命不一样 是吧

它是找规律

根据这种规律性

最后综合出来说相关性

那我们发现你

我可能直接不能直指问题的本质

但是我发现有其它的

我们容易观测到的

一些趋势和特征

那么能够对应起来

你这个个体的发展趋势的时候

那么这时候就用这些来描述

你未来的一个趋势

这个就是什么 快速度

取决最终你产生的结果

能不能应用到实际当中去

所以从我们自己总结起来

也是这三个特征

但是的在现在是吧

最大的挑战是什么

我们说有几块

第一个叫做数据是孤立的 对吧

我刚才提到

其实我们说政府手里头

应该有将近80%的数据

工商 税务 社保 海关等等

我们现在在国内某一个地区

跟一个这个区域政府合作

采集了它47个部委的数据

非常海量

但是这只是一个起点

一个开始

这只是一个试验

但是在中国很多地方

这件事情是非常难做到的

这就是什么 数据孤立

虽然你可能从不同的角度

你能满足多样性的需求

但是这个多样性

是存在每个自己掌握数据的

机构 个体和公司手里

第二就是数据是杂乱的 对吧

在这个信息化的过程当中

大家都有各自的标准

各自的想法 各自的格式

各自的命名 是吧

甚至你的存储的这个数据库

系统都不一样

这也是我们面临的第二个挑战

第三个就是我们传统分析方法

是落后的 是吧

有很多的数据 对吧

我们说也在用 对吧

我们比如说银行说

你看 包括我们最熟悉的

是吧 比如说阿里 京东

他们其实对大数据说也在用

但是我们发现

他的方法有些还是传统的

比如说简单的 同比 环比 特征

搞的很好 看起来很好

但实际上我们说

它只是叫什么

只是告诉你一点点片面的东西

能不能用来决策呢 对吧

能不能用来判断

一个个体和经济体的好坏呢

到这个程度的时候

它往往是失效的 对吧

所以我们说按照

比如说大家有些人说

大数据就是统计学

但是从这个角度来说

如果你没有去经过

把数据这个清洗出来 是吧

把数据规律化

把数据的相关性算出来

你简简单单

只是做一些统计分析的

它不是大数据

那么最终能不能支持到什么

叫决策

现代到最后决策这个环节的时候

把前面很多东西都扔掉

还是要靠拍脑袋来做

所以我们说传统的这个统计分析

它并不是大数据

那么 对 刚才说了是吧

如果用过去的分析方法

可能还是看到了一小段

看到了片面

它不能窥其全貌

那我们再比较一下

一步一步的落实到

我们说的今天的主题

就是大数据在金融方面的应用

对吧

我们说在这个比较一下

大家现在都在说大数据

那我们原来是不是能够

把它说成是小数据时代

小数据时代的这个整个的金融

它有一个非常重要的基石

就是财务报表

财务报表的思路是什么

是一个等式

这个世界是完美的 对吧

是一个等式

资产等于负债加所有者权益

那么它是一个二维的静态的

它是一个

已经被加工过的一个数据

那么大数据时代

它完全颠覆了

小数据时代的这种模式

它看的是什么

看的是过程 看的是结果

我们说是一个三维

这三维怎么来看呢

我们无论是从个人也好

企业也好

我们给它分成这三个轴

第一个轴 纵轴 叫过程

企业叫财富这个积累的过程

财富创造的过程

个人叫什么

个人的创造财富能力的

一个积累的过程 对吧

那么横轴是什么 结果

你努力半天

你最后产生了什么样的结果

第三个轴叫时间轴

就我们放在一段历史时期

过去来看 对吧

那么你的这个结果

和你的过程要有对应

如果没有对应

那这个结果是打问号的 存疑的

所以我们说

它是一个三维动态的

最关键一点叫明细数

叫什么

叫最小颗粒度的

在某一个时间点

被记录下的一个数据

我们说这叫明细数

通过大量的明细数

作为一个基础

这个作用待会儿会讲到

就是什么呢

在中国在现有体系不完善的

这样一个社会基础上

社会环境基础上

第二叫什么

叫造假成本非常低的

这么一个社会环境基础上

怎么去伪存真

那么我们把握住明细数据

这是一个关键点

话说回来 我们再看看

对企业来说 什么

刚才说了订单 物流 库存

帐单 应收 结算等等

这个都是一个过程

是吧 是纵轴

横轴比如说我们产生了结果

跟这个传统的

这个意义上的财务指标

是不一样的

我们把你企业花的钱

也看成一个结果

因为你得先有收入

先有银行流水进来之后

你给员工发工资是吧

你支付社保

你有这个财务的一些行为是吧

你交税了

给个人交税 交保险 对吧

去买水电费了 对吧

你可能还有一些这个

资产方面的支出

金融方面的行为

等等这些都是一个结果

这个同理

也要通过时间轴对应起来

比如说你产生了一个

200万的收入

但是我们发现

在你经营过程当中

没法跟这个结果去对应的时候

那么这个数据我们就不采信

当然这叫企业叫什么

大家发现一个特征

叫企业内部数据

它是真正的从企业内部

挖掘出来的数据

当然还有一些外部数据

刚才说了环境 软实力

征信 公检法

当然还有一些黑天鹅事件

会影响到企业

那么这个我们说逐渐扩张

这个我们一开始的时候

就直接去直奔这个企业内部数据

这个是什么

这个是最难的一件事 对吧

这个涉及到敏感和保密

待会儿会讲到

企业为什么愿意把这个东西

给我们提供

那么到今天为止

我们说我们累计了这个数据

已经有点老了

将近50万家企业数据

那么第二个

我们还会有源源不断的

新鲜的数据更新

更新是一个非常重要的一个特征

就是大数据如果不更新

那它很快就失效 对吧

我们有三个数据入口

所以讲到这说一下

就是我们现在做大数据的

很多这个研究机构也好

企业也好

最头疼的是什么

是没有数据 对吧

所以我们当时做这件事情

要解决两个问题

这个就包括我们所有的

将来创业也好 什么也好

为什么说要跨界 还要全才

就是说你要碰到所有的问题

你都得自己去面对

自己去解决

没有人去给你

提供一个很好的环境

让你舒舒服服就把这些事都做了

所以说我们说

这个做大数据有两块

一个叫什么 叫数据入口

一个叫数据算法和建模

入口的话有些比较有优势

比如说天生的

阿里 京东 这些做电商

它们本身在自己的封闭的平台上

就有大量的数据

它自己一挖一挖

这金矿就能挖出来

但是对我们金电联行来说

没有数据

就相当于我没有矿 没有石油

是吧

我没有这个所有权

那我怎么做

那么我得慢慢的去找 是吧

去发掘大家没有发掘的这些数据

然后我通过一种方法采集上来

那么逐渐到今天

我们形成了我们三个数据入口

一个是叫

我们有一个数据挖掘机器人

从互联网上和从内置到

企业的信息化系统里头

去挖掘数据

第二个数据入口

当然就是我们的一些合作伙伴

是吧

包括企业自主填报

把它的一些数据

能够按照我们的明细的要求

给导入进来

当然我们这个前提是

我们有一项技术

叫做去伪存真

大数据清洗的技术

那么有了这个之后

告诉企业说你不要造假

你不要提供假数据

我都能清洗出来

那么在这个前提下

我们再做了第二个数据入口

第三个数据入口

其实我们会看到下面

跟政府合作 对吧

刚才说其实

我们说中国在我认为

应该是拥有全球最好的数据资源

为什么这么说呢

第一 是吧 我们大家都知道

中国有全球最好的税收系统

第二中国有全球最好的

文化记录的这些系统

因为这两块说实在的

这都是政府非常关注的事情

那么它原来通过技术手段

通过信息化的手段

实际上本身就积累了大量的数据

但是到今天它真正的价值

还没有被挖掘出来

所以说我们有了这个挖掘技术

就相当于我们说

我能够有采矿技术

提炼原油的技术 是吧

可能别人提炼

转化率只有30%

我能够变成80% 是吧

我能把你的数字直接变现

是吧 数字资产化

我能通过数据

给你做各种各样的服务

那产生价值之后

数据的提供方才有动力

来给我们开放数据

所以我们说任何事情

真的是尤其是做大数据

这个一定是一个

这样一步一步

积累下来的一个过程

所以像金电联行做了七年

这个稍微多讲两句

就是我们这个

我也在公司负责投资

就有投资方说

你看你们公司不行

你们做了七年才做到今天

你看人家这个

有些做两年三年就上市了

这个市值就上百亿了

他说你看你们不sexy

我说对不起

你可能要自打我们之后

你要改一下这个观点

怎么说呢

我说大数据

它本身是一个叫什么

叫实验科学 对吧

它是要从数据当中去找规律

找到规律之后再找相关性

找着相关性之后

再要跟实际的我们的经验去对应

哪些东西能跟我们实际当中用上

第三个还要什么

第四个最重要的叫什么

要经过实践的检验

没有这样一个周期

没有这样一个一步一步的环节

最终是达不到

我们现在想要的一个结果

所以我说将来很有可能

你的判断标准会变

就是只有当你的公司

经过了几年

七八年之后的实践的检验之后

你的价值 你的模型

才能够被认可

这个稍微绕了个弯

但是我就在想

大数据怎么去

一步一步的做起来

怎么去落地

怎么产生价值

这都是我们希望

或者说我们愿意

共享出来的这么一个必经之路

大数据技术与应用课程列表:

李国杰:面向大数据的数据科学

-完整讲座

--完整讲座

-李国杰:面向大数据的数据科学--课后习题

吴甘沙:大数据分析师的卓越之道

-数据思维方式的改变

--数据思维方式的改变

-数据的假设与采集

--数据的假设与采集

-数据的准备

--数据的准备

-数据的分析

--数据的分析

-数据的解释与验证

--数据的解释与验证

-吴甘沙:大数据分析师的卓越之道——课后习题

董飞:硅谷公司的大数据实战分析

-个人介绍

--个人介绍

-硅谷热门公司

--硅谷热门公司

-大数据简介

--大数据简介

-大数据平台系统

--大数据平台系统

-工业实践

--工业实践

-结尾

--结尾

-董飞:硅谷公司的大数据实战分析--课后习题

杨光信:数据系统架构

-数据系统架构历史

--数据系统架构历史

-从sql到nosql

--从sql到nosql

-数据库系统实现变革

--数据库系统实现变革

-负载融合

--负载融合

-数据系统架构成本

--数据系统架构成本

-杨光信:数据系统架构——课后习题

时磊:大数据网络可视化

-什么是可视化

--什么是可视化

-网络可视化

--网络可视化

-大数据带来的新挑战

--大数据带来的新挑战

-大数据网络可视化的若干案例

--大数据网络可视化的若干案例

-时磊:大数据网络可视化—— 课后习题

彭元:网络安全与大数据

-网络安全概述

--网络安全概述

-大数据安全分析平台

--大数据安全分析平台

-大数据安全应用

--大数据安全应用

-大数据平台安全

--大数据平台安全

-彭元:网络安全与大数据——课后习题

钟义信:“人工智能与大数据”的创新研究

-人工智能系统的本质功能模型

--人工智能系统的本质功能模型

-隐性智慧,显性智慧

--隐性智慧,显性智慧

-人工智能:能与不能

--人工智能:能与不能

-人工智能的技术现状

--人工智能的技术现状

-机制主义人工智能模型

--机制主义人工智能模型

-信息转换和智能创生定律

--信息转换和智能创生定律

-人工智能与大数据

--人工智能与大数据

-钟义信:“人工智能与大数据”的创新研究——课后习题

吴军:数据为王和机器智能的时代

-什么是机器智能

--什么是机器智能

-大数据的重要性及特点

--大数据的重要性及特点

-大数据中的因果关系与关键技术

--大数据中的因果关系与关键技术

-大数据与机器智能

--大数据与机器智能

-大数据思维

--大数据思维

-讲座问答环节

--讲座问答环节

-吴军:数据为王和机器智能的时代——课后习题

苏中:从大数据到认知计算

-大数据概述

--大数据概述

-大数据相关新趋势

--大数据相关新趋势

-大数据技术创新1

--大数据技术创新1

-大数据技术创新2

--大数据技术创新2

-大数据技术创新3

--大数据技术创新3

-大数据商业价值和前景

--大数据商业价值和前景

-大数据机遇和挑战

--大数据机遇和挑战

-苏中:从大数据到认知计算——课后习题

王新锐:金融大数据的法律实践

-金融大数据概述

--金融大数据概述

-用户个人信息分类

--用户个人信息分类

-金融大数据法律框架

--金融大数据法律框架

-实际案例和业界实践

--实际案例和业界实践

-核心风险点

--核心风险点

-王新锐:金融大数据的法律实践——课后习题

刘鹏:互联网变现与计算广告

-互联网与商业化

--互联网与商业化

-大数据与计算广告

--大数据与计算广告

-计算广告介绍

--计算广告介绍

-数据交易

--数据交易

-刘鹏:互联网变现与计算广告——课后习题

杨保华:区块链与数据科学

-从记账技术到区块链

--从记账技术到区块链

-区块链确保数据真实性

--区块链确保数据真实性

-区块链确保数据安全性

--区块链确保数据安全性

-区块链衡量数据价值

--区块链衡量数据价值

-区块链的应用和总结

--区块链的应用和总结

-杨保华:区块链与数据科学——课后习题

杨紫陌:个性化内容推荐

-个性化推荐系统

--个性化推荐系统

-推荐系统的召回与排序

--推荐系统的召回与排序

-智能制作之个性化海报

--智能制作之个性化海报

-线上推荐系统其它要素

--线上推荐系统其它要素

-杨紫陌:个性化内容推荐——课后习题

陆祁:用户行为大数据

-个人介绍及用户理解背景

--个人介绍及用户理解背景

-用户理解与用户画像

--用户理解与用户画像

-案例1:用户属性识别

--案例1:用户属性识别

-案例2:自然人识别

--案例2:自然人识别

-案例3:WOI与社交关系识别

--案例3:WOI与社交关系识别

-陆祁:用户行为大数据——课后习题

阳任科:大数据与AI的内容分析

-内容智能生态——数据、算法、应用

--内容智能生态——数据、算法、应用

-大数据在内容分析的应用

--大数据在内容分析的应用

-IP价值评估系统

--IP价值评估系统

-爱奇艺的剧本评估

--爱奇艺的剧本评估

-爱奇艺的智能评分

--爱奇艺的智能评分

-阳任科:大数据与AI的内容分析——课后习题

王栋:美团外卖的大数据应用

-外卖行业及场景简介

--外卖行业及场景简介

-餐饮及外卖行业大数据应用框架

--餐饮及外卖行业大数据应用框架

-案例分析:智能营销场景的用户画像

--案例分析:智能营销场景的用户画像

-案例分析:智能助手场景的菜品画像

--案例分析:智能助手场景的菜品画像

-王栋:美团外卖的大数据应用——课后习题

赵楠:商业思维与大数据技术在美团旅行业务中的结合

-旅行业务的特点

--旅行业务的特点

-美团旅行业务的用户画像构建

--美团旅行业务的用户画像构建

-用户画像的应用案例

--用户画像的应用案例

-住宿需求预测问题

--住宿需求预测问题

-营销补贴策略建模

--营销补贴策略建模

-赵楠:商业思维与大数据技术在美团旅行业务中的结合——课后习题

陈彧:美团点评金融服务的大数据与人工智能

-互联网金融背景介绍

--互联网金融背景介绍

-互联网金融科技

--互联网金融科技

-数据智能的三个案例

--数据智能的三个案例

-技术展望

--技术展望

-陈彧:美团点评金融服务的大数据与人工智能——课后习题

毛波:阿里全息大数据构建与应用

-数据的进化历程

--数据的进化历程

-阿里DMP平台介绍

--阿里DMP平台介绍

-核心技术及案例

--核心技术及案例

-数据应用

--数据应用

-毛波:阿里全息大数据构建与应用——课后习题

韩定一:在线营销中的竞价机制与数据价值

-在线营销

--在线营销

-竞价机制

--竞价机制

-数据价值

--数据价值

-韩定一:在线营销中的竞价机制与数据价值——课后习题

龚笔宏:大数据在工业界中的经典案例分享

-竞价排名搜索

--竞价排名搜索

-主要技术问题

--主要技术问题

-点击率预测概述

--点击率预测概述

-点击率预测实践

--点击率预测实践

-龚笔宏:大数据在工业界中的经典案例分享——课后习题

[补充] 郝井华:即时配送中的人工智能

-即时配送业务的背景及挑战

--即时配送业务的背景及挑战

-案例1:订单分配策略

--案例1:订单分配策略

-案例2:供需平衡策略

--案例2:供需平衡策略

-未来展望

--未来展望

-郝井华:即时配送中的人工智能——课后习题

[补充] 陈辉:数据驱动营销

-什么是数据驱动营销

--什么是数据驱动营销

-LTV留存分析

--LTV留存分析

-RFM会员体系

--RFM会员体系

-消费者微群画像

--消费者微群画像

-渠道倾向性分析及行业竞争分析

--渠道倾向性分析及行业竞争分析

-机器学习潜客挖掘模型

-- 机器学习潜客挖掘模型

-陈辉:数据驱动营销——课后习题

[补充] 艾小缤:大数据评价体系在金融、征信领域的创新

-金融大数据时代

--金融大数据时代

-大数据客观信用

--大数据客观信用

-我国的金融环境

--我国的金融环境

-客观信用的实践

--客观信用的实践

-应用案例与成果

--应用案例与成果

-艾小缤:大数据评价体系在金融、征信领域的创新——课后习题

[补充] 郑宇:大数据驱动智能城市

-外部链接

--外部链接

讨论专题

-课程总结讨论单元1/2

-课程讨论总结单元2/2

金融大数据时代笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。