当前课程知识点:大数据技术与应用 >  毛波:阿里全息大数据构建与应用 >  核心技术及案例 >  核心技术及案例

返回《大数据技术与应用》慕课在线视频课程列表

核心技术及案例在线视频

下一节:数据应用

返回《大数据技术与应用》慕课在线视频列表

核心技术及案例课程教案、知识点、字幕

这个是对上个图的一个补充

大家知道我们有些核心技术

可能是其他的人不太好做

或者做的可能不会那么好的东西

ID-Mapping

就是异构数据的跨屏跨渠道的

整合方式

这个东西首先你的数据要足够多

而且场景要足够的丰富

关联要足够的

那个逻辑足够的那个复杂存在

第二是多维数据的随意组合透视

这个是我们非常骄傲的一点

就是我们可以实现数千

成千上万个的标签随意组合

并且能实现秒级的返回

另外一个这个大家都懂

数据分析挖掘这一套东西

被说烂了不说了

另外数据安全和控制

我们的算法模型

这里就讲了一个Lookalike

Lookalike这个人群扩展呢

对现在很多的品牌商非常喜欢

大家知道现在很多品牌商

他可能积累了十年

然后他CM里面

有十五万用户

但是他想再

他想我的下一个十五万用户

在哪里

我要花多长时间去才能获得

算了一下可能还得十年

那大家知道

这意味着什么

意味着可能一个

他早就被一个还没出生

甚至看不见的对手

早就超过了是吧

所以他们非常需要

迫切的需要

把他们的那个原有的那个节奏

获取信用或者能力能够提升起来

所以我们这个呢

我们这个算法

正好能满足它的那个功能

一会儿下面有张PPT

我们会讲到

另外一个是实时人群的

定向与反馈

这个刚才讲过

实时非常重要

以导航为例

大家去感受一下

另外一个是全链路的效果评估

这个也是要建立在

有足够多的数据

足够丰富的场景上

才能做的到

最后回到这

最后一个是API

大家知道我们现在

很多很多的数据大家都知道有

但是用起来成本非常高的话

会大大制约你这个事情的

一个进展

所以易用性就变得非常的重要

易用性呢

我们最好是把它做成一些

即插即用

或者想用我就去取的模式

就像一个U盘

你想有一堆的那个

USB的那个接口在里面

我可能想用这个U盘里的东西

把它插进去

那我就用了

用完之后把它拔走 对吧

这种就非常的高

那你要说拿那个原来的

传统的那个PC机的那个硬盘

然后你拧五个螺丝是吧

然后再把它装回来

那样的话我估计

就没有太多人会去做这样的事情

这里也一样

所以我们开发了很多的API

这个地方就是刚才讲

我们以Lookalike

这个模型扩展为例

假设我们这个

大家看一下左边 左边

就是首先我们Lookalike呢

首先要有一些种子用户

这个种子用户呢

比如是一个品牌商的

一个CM里面的VIP

它经过十年积累了这十万用户

这就是我非常优质的

只要是这样的人

我基本上就能把它发展成

我的忠实用户

所以先有这么一个东西

然后呢我们在系统里会去分析

这些种子用户的特征列表

分析完之后

可能是包括年龄对于性别

他的兴趣偏好

包括他的一些行为轨迹

等等这样的东西

可能抽取出十到二十个

这样的东西

然后呢通过那个模型去计算

找到它的显著特征

如果这里有一点呢

如果你觉得他的显著特征

还不够显著

你就再对这个特征

再去做一些关联扩展

这个后面我们也会讲到

那根据这个显著特征

找到每个特征对应的用户列表

就是相对于是一个

定向的去做扩展了

那最后再做一个combine的操作

合成一个Lookalike列表

大概是这么一个过程

那这个地方核心的东西有几个

第一个是我们这个种子用户

也就是数据层面的东西

第二个是对种子用户的

一个特征的提取

那最后呢就是我们发现说

在这种用这个

Lookalike模型的时候

不同的用户会有不同的那个偏好

有些人他说我这十万

我就想要一百万

我要保住一百万这个量

有些用户呢可能说

那我也不管你有多少

反正跟这个用户

相似百分之八十以上的

你都给我

是一百万还是两百万

还是五十万都可以

所以我们当时就定了一些参数

放大倍数和缩减效果

这样的参数去做一个

定向的去控制

这是一个例子

那边是一个图例

这个是一个那个标签挖掘的

一个例子

知识图谱大家应该

应该从去年前年开始

应该有听过

这个是从美国传来的一个词

大家简单看一下

这个东西

当时我们为什么会去做呢

是因为虽然我们有大量的数据

但是依然会在某一些特定的场景

或者特定的时间地域下面

我们会出现数据稀疏的情况

那在稀疏的情况怎么办

当然有一个办法就是我们

不去管它

那就损失掉这部分那个价值

但是你可以稍微多做一点工作

就是把那个稀疏性的东西呢

想办法通过它的父子关系

等价关系和实例关系

把它补充进来

什么意思呢

比如说可能叫张三这个人

你可能对他的信息了解不多是吧

但是你说张三是个二十五岁的

刚上研一的一个研究生

这个时候你是不是对他的信息

会丰满一些

然后你再补充说

他可能家在北京的密云县

然后每周可能还要回家一趟

对吧 这样你对他的

脑子里对他的幻想

是不是更清晰一些

如果这样你把张三这个人

归到那个二十五岁的研究生

然后归到密云县的一个

那个每周要去往返

北京和密云的一个人

这样的话你能对他的信息

对他的那个行为了解的更透彻

那这个东西

其实就是用来干这个事情的

刚才讲了我们有一个

第三方的开发市场

就是我们希望有很多的

第三方的算法开发

和一些垂直行业的达人

也能够来贡献他们的一些力量

那这个地方呢

我们是做了那个

首先有一个非常

那个基础的阿里云环境

中间我们有一个数据脱敏方案

因为我让第三方来加工

我不能把那个数据告诉他

我的数据不能通过系统拷贝出去

当然人也不能看

我如果人肉眼看到了

大家知道中国最不缺的

就是人肉是吧

他每天看一百条

每天看一百条

他一年之后说

我有很多条

我把它拿走了是吧

每天他可以去这样做

所以这个地方一定要有一个脱敏

脱敏最直接的就是

一个是加密

第二个是把那些ID

无序列化 无意义化

假设你的那个手机号

这个是个有内容的

但是我把它MD5一下

那就没有意义了 对吧

那你人肉看不出它的意义

然后中间呢

我们是有一个那个标签市场的

就是我们这些开发者

做出的一些这种数据的这种产品

我们希望它能够直接对接到

一些应用方去

我们的商家 我们的品牌商

或者我们的一些

那个公益方面的一些东西

他能够直接看到他们的一些结果

然后在使用的一些效果和收益

再回来 形成一个闭环

这是第三方开发者的参与模式

大数据技术与应用课程列表:

李国杰:面向大数据的数据科学

-完整讲座

--完整讲座

-李国杰:面向大数据的数据科学--课后习题

吴甘沙:大数据分析师的卓越之道

-数据思维方式的改变

--数据思维方式的改变

-数据的假设与采集

--数据的假设与采集

-数据的准备

--数据的准备

-数据的分析

--数据的分析

-数据的解释与验证

--数据的解释与验证

-吴甘沙:大数据分析师的卓越之道——课后习题

董飞:硅谷公司的大数据实战分析

-个人介绍

--个人介绍

-硅谷热门公司

--硅谷热门公司

-大数据简介

--大数据简介

-大数据平台系统

--大数据平台系统

-工业实践

--工业实践

-结尾

--结尾

-董飞:硅谷公司的大数据实战分析--课后习题

杨光信:数据系统架构

-数据系统架构历史

--数据系统架构历史

-从sql到nosql

--从sql到nosql

-数据库系统实现变革

--数据库系统实现变革

-负载融合

--负载融合

-数据系统架构成本

--数据系统架构成本

-杨光信:数据系统架构——课后习题

时磊:大数据网络可视化

-什么是可视化

--什么是可视化

-网络可视化

--网络可视化

-大数据带来的新挑战

--大数据带来的新挑战

-大数据网络可视化的若干案例

--大数据网络可视化的若干案例

-时磊:大数据网络可视化—— 课后习题

彭元:网络安全与大数据

-网络安全概述

--网络安全概述

-大数据安全分析平台

--大数据安全分析平台

-大数据安全应用

--大数据安全应用

-大数据平台安全

--大数据平台安全

-彭元:网络安全与大数据——课后习题

钟义信:“人工智能与大数据”的创新研究

-人工智能系统的本质功能模型

--人工智能系统的本质功能模型

-隐性智慧,显性智慧

--隐性智慧,显性智慧

-人工智能:能与不能

--人工智能:能与不能

-人工智能的技术现状

--人工智能的技术现状

-机制主义人工智能模型

--机制主义人工智能模型

-信息转换和智能创生定律

--信息转换和智能创生定律

-人工智能与大数据

--人工智能与大数据

-钟义信:“人工智能与大数据”的创新研究——课后习题

吴军:数据为王和机器智能的时代

-什么是机器智能

--什么是机器智能

-大数据的重要性及特点

--大数据的重要性及特点

-大数据中的因果关系与关键技术

--大数据中的因果关系与关键技术

-大数据与机器智能

--大数据与机器智能

-大数据思维

--大数据思维

-讲座问答环节

--讲座问答环节

-吴军:数据为王和机器智能的时代——课后习题

苏中:从大数据到认知计算

-大数据概述

--大数据概述

-大数据相关新趋势

--大数据相关新趋势

-大数据技术创新1

--大数据技术创新1

-大数据技术创新2

--大数据技术创新2

-大数据技术创新3

--大数据技术创新3

-大数据商业价值和前景

--大数据商业价值和前景

-大数据机遇和挑战

--大数据机遇和挑战

-苏中:从大数据到认知计算——课后习题

王新锐:金融大数据的法律实践

-金融大数据概述

--金融大数据概述

-用户个人信息分类

--用户个人信息分类

-金融大数据法律框架

--金融大数据法律框架

-实际案例和业界实践

--实际案例和业界实践

-核心风险点

--核心风险点

-王新锐:金融大数据的法律实践——课后习题

刘鹏:互联网变现与计算广告

-互联网与商业化

--互联网与商业化

-大数据与计算广告

--大数据与计算广告

-计算广告介绍

--计算广告介绍

-数据交易

--数据交易

-刘鹏:互联网变现与计算广告——课后习题

杨保华:区块链与数据科学

-从记账技术到区块链

--从记账技术到区块链

-区块链确保数据真实性

--区块链确保数据真实性

-区块链确保数据安全性

--区块链确保数据安全性

-区块链衡量数据价值

--区块链衡量数据价值

-区块链的应用和总结

--区块链的应用和总结

-杨保华:区块链与数据科学——课后习题

杨紫陌:个性化内容推荐

-个性化推荐系统

--个性化推荐系统

-推荐系统的召回与排序

--推荐系统的召回与排序

-智能制作之个性化海报

--智能制作之个性化海报

-线上推荐系统其它要素

--线上推荐系统其它要素

-杨紫陌:个性化内容推荐——课后习题

陆祁:用户行为大数据

-个人介绍及用户理解背景

--个人介绍及用户理解背景

-用户理解与用户画像

--用户理解与用户画像

-案例1:用户属性识别

--案例1:用户属性识别

-案例2:自然人识别

--案例2:自然人识别

-案例3:WOI与社交关系识别

--案例3:WOI与社交关系识别

-陆祁:用户行为大数据——课后习题

阳任科:大数据与AI的内容分析

-内容智能生态——数据、算法、应用

--内容智能生态——数据、算法、应用

-大数据在内容分析的应用

--大数据在内容分析的应用

-IP价值评估系统

--IP价值评估系统

-爱奇艺的剧本评估

--爱奇艺的剧本评估

-爱奇艺的智能评分

--爱奇艺的智能评分

-阳任科:大数据与AI的内容分析——课后习题

王栋:美团外卖的大数据应用

-外卖行业及场景简介

--外卖行业及场景简介

-餐饮及外卖行业大数据应用框架

--餐饮及外卖行业大数据应用框架

-案例分析:智能营销场景的用户画像

--案例分析:智能营销场景的用户画像

-案例分析:智能助手场景的菜品画像

--案例分析:智能助手场景的菜品画像

-王栋:美团外卖的大数据应用——课后习题

赵楠:商业思维与大数据技术在美团旅行业务中的结合

-旅行业务的特点

--旅行业务的特点

-美团旅行业务的用户画像构建

--美团旅行业务的用户画像构建

-用户画像的应用案例

--用户画像的应用案例

-住宿需求预测问题

--住宿需求预测问题

-营销补贴策略建模

--营销补贴策略建模

-赵楠:商业思维与大数据技术在美团旅行业务中的结合——课后习题

陈彧:美团点评金融服务的大数据与人工智能

-互联网金融背景介绍

--互联网金融背景介绍

-互联网金融科技

--互联网金融科技

-数据智能的三个案例

--数据智能的三个案例

-技术展望

--技术展望

-陈彧:美团点评金融服务的大数据与人工智能——课后习题

毛波:阿里全息大数据构建与应用

-数据的进化历程

--数据的进化历程

-阿里DMP平台介绍

--阿里DMP平台介绍

-核心技术及案例

--核心技术及案例

-数据应用

--数据应用

-毛波:阿里全息大数据构建与应用——课后习题

韩定一:在线营销中的竞价机制与数据价值

-在线营销

--在线营销

-竞价机制

--竞价机制

-数据价值

--数据价值

-韩定一:在线营销中的竞价机制与数据价值——课后习题

龚笔宏:大数据在工业界中的经典案例分享

-竞价排名搜索

--竞价排名搜索

-主要技术问题

--主要技术问题

-点击率预测概述

--点击率预测概述

-点击率预测实践

--点击率预测实践

-龚笔宏:大数据在工业界中的经典案例分享——课后习题

[补充] 郝井华:即时配送中的人工智能

-即时配送业务的背景及挑战

--即时配送业务的背景及挑战

-案例1:订单分配策略

--案例1:订单分配策略

-案例2:供需平衡策略

--案例2:供需平衡策略

-未来展望

--未来展望

-郝井华:即时配送中的人工智能——课后习题

[补充] 陈辉:数据驱动营销

-什么是数据驱动营销

--什么是数据驱动营销

-LTV留存分析

--LTV留存分析

-RFM会员体系

--RFM会员体系

-消费者微群画像

--消费者微群画像

-渠道倾向性分析及行业竞争分析

--渠道倾向性分析及行业竞争分析

-机器学习潜客挖掘模型

-- 机器学习潜客挖掘模型

-陈辉:数据驱动营销——课后习题

[补充] 艾小缤:大数据评价体系在金融、征信领域的创新

-金融大数据时代

--金融大数据时代

-大数据客观信用

--大数据客观信用

-我国的金融环境

--我国的金融环境

-客观信用的实践

--客观信用的实践

-应用案例与成果

--应用案例与成果

-艾小缤:大数据评价体系在金融、征信领域的创新——课后习题

[补充] 郑宇:大数据驱动智能城市

-外部链接

--外部链接

讨论专题

-课程总结讨论单元1/2

-课程讨论总结单元2/2

核心技术及案例笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。