当前课程知识点:大数据技术与应用 >  陆祁:用户行为大数据 >  用户理解与用户画像 >  用户理解与用户画像

返回《大数据技术与应用》慕课在线视频课程列表

用户理解与用户画像在线视频

下一节:案例1:用户属性识别

返回《大数据技术与应用》慕课在线视频列表

用户理解与用户画像课程教案、知识点、字幕

首先来讲一下

什么是我们说的这个用户理解

我们在想如果一个用户

他通过各种各样的设备

来访问你的网站的时候

我们想要知道这个设备之后

他其实是一个什么样的用户

这个其实并不是

我们要去窥探他的隐私

我们不需要知道你叫什么名字

你身份证号是哪儿

你住在几零几室

是具体的一个怎样一个社会人

但是我们关注的他的一个重点是说

我们想知道这个人

他是个男的还是个女的

他是20岁的小伙 还是

是一个40岁的大叔

他是一个小镇青年

还是一个一二线城市的一个

高职白领 是个学生

他的兴趣偏好

他经常比如说出没时间

他的家庭环境是什么样子的

他经常访问的一些网络的环境

还有他 比如说身边的朋友

是什么样子的人

他的比如说消费能力等等等等

比较全方位去了解这样一个用户

如果我们对用户的这一些

各种各样的属性去了解

挖掘的比较深入的话

我们在做后期的一些内容分发上

才能做到真正的他的一个

精准地去触达

这个内容是一个广义上的内容

他可能是说我们会看到的一些

广告的分发或者是说视频的分发

或者是像小说啊

或者是一些动画 漫画等等

各种各样内容的分发

都会是内容分发的一些

它的一个不同的实体

但是它需要做一些精准的触达的话

我们肯定是要需要了解它用户本身

我们想如果是一个视频网站的话

我们可以想象他背后的一个

视频的一个库的话

其实是一个非常大的

一个海量的一个体量

那比如说用户 单用户来的话

我到底要给他看什么样的数据

什么样的视频

如果是我们不了解这个用户

那我们可能只能给他一些

头部的热的

可能跟这个用户的他本身的

长期的兴趣和他近期追的一些剧

或者是他近期产生的一些兴趣

是不相符的 那他可能就找不到

他真正想要去感兴趣的内容

这个用户可能

最终在这个网站里面流失了

然后 就是说所以我们需要去

精准地触达这个人

让用户可能在短时间的浏览

或者是翻不同的页面的时候

就能快速去找到他自己想要

感兴趣的这个内容

然后从另外一个角度来说呢

就是内容生产制作方

他也希望说你这个平台有能力

去帮我去分发去触达到所有跟我

内容最相关可能感兴趣的

尽可能大的它的一个受众群体

这个就需要我们网站对

来网站的每一个用户都有一些

深入地了解而不是

把他当成一个能启动的用户

做一个泛泛的一个推广

那他这样的话

最终的一个点击和观影

就是效率是非常的一个低下的

所以这就是说

我们为什么要做这个用户理解

用户理解我们所关注的一些

重点的一些方向

通常来说呢

用户理解的它的一些做法的话

业界通常会是有两个方向

一种是我们叫它Persona

它就是一种偏小数据的

小规模用户体量的时候

就很多用研会做一些

点对点的抽样的一些

比如说调查问卷

或者是说去电话沟通

去真正了解这个用户说

你是为什么来

你到底要关注一些什么样的内容

他会去问的比较细

能拿到各种各样的数据

但是用这样的数据

他去推演整个产品

或者是说整个网站的这个数据

只能是以点带面

他这样的做法还有一个问题是说

我一次访谈

他可能只能一次性知道他当前

比如说这个用户的状态

那可能过了三五个月

半年之后那这个用户的状态都变了

那这一次访谈相得到的一些信息

可能它就不是一个比较完整

或者说比较是反映

当时情况的这样一个数据

然后另外一种方法呢

它是Profile

它是用户画像的这样一个做法

它是基于海量数据

去基于用户他的一个

反馈上来的一些行为日志

去从里面去做一些深入的挖掘

把它变成了每个用户

他身上的不同的标签

然后通过不同的标签组合

我们可以找到我们需要的

各种各样的一些用户

这样的话 他的这种做法

他是可以规模化地去投入和应用的

它可以自动化 它可以系统化地去做

给每一个 就是用户实体

去挖掘他对应的一个标签

他需要的 他可能的

一些属性的 一些识别等等

所以在爱奇艺的

像这样上亿规模的

这样一个互联网的公司里面

通常都是去走第二个方式

去走用户画像的这样一个模式

去真正去探索和理解他的一个用户群体

我这边就是简单展示了一下

我们这边做的一些用户理解的

他的一些体系

他背后是一个标签的一个体系的库

其实我们在数据构建的时候

我们可能有用户的一个数据的库

然后他的一些行为库 他的特征库

他的标签库等等 像这里的话

是一个概念性的展示

我们这个标签库的这样的一套体系

他可能是包括

每一个用户的他的自然的属性啊

设备的属性他的身份行为社交等等

各个方面的一些属性

这些标签其实是有大几百号

这里面绝大多数

是通过统计和抽取的方式

去得到一些有商业价值

有业务需求的一些标签

还有几十维

是我们通过数据挖掘的方法

去探索 去摸索出来的

去验证出来

他的有效性的一些这样的标签

就是统计型的这样标签

它其实也不是说

简单的是说就可以 比如说产出

举个例子像我们说

我来研究说这个用户

他到底喜欢是哪一个明星

这个点其实看起来挺简单

其实同学们也可以去想一下

我看了很多剧

那是不是剧里出现的每个明星

都是我喜欢的呢

他出现的 比如说主演 次演

他的一个不同的比如说级别

然后我去年看的

或者我上个月看的

我看的频率我怎么样

体现在我的偏好的这个

比如说 标签的这个设计当中

其实也是有很多算法的一些设计

虽然它是一个偏统计型的标签

但是我们会去把很多业务的内容

去在设计这个标签的时候

融入到统计的方法当中

会考虑比如说时间的衰减

然后各种 比如说

怎么样能够体现说

你真正喜欢某一个用户

近期的或者是长期的

中长期的一个偏好

在这种标签的设计当中

但是我接下来会讲的具体的内容

其实会重点会放在我们纯数据挖掘

产生的这些标签

他们可能是从无到有

或者说从少到多的

这样一个探索去挖掘的这样一个过程

这个是我下面就是会讲的一些重点

这个图是一个比较简单的一个概念图

它就是说我们怎么从

比如说用户的

他的各种各样的行为的数据

去进行数据挖掘 机器学习

然后去提取成一个标签

它大概是这样一个流程

如果放到一个更具体的一个

比如说分层的这样一个

数据流的这样一个流程当中体现

我们大概是这样一个图

给大家解释一下

一般来说就是在底层的时候

我们去会收集很多用户

他的一个基础的数据

它的来源非常多

可能是比如说用户在站内

产生的各种行为所形成的

他的用户行为的一些日志数据

还有比如说

用户填写或者是说

其他的维度产生的一些

它的一些比如说标签的属性的数据

还有第三方交换

然后或者是说

站外一些扒取的各种各样的数据

他们会存储在整个数据的数仓的

不同的一个层次里面

这是我们需要在这个数据网上

做挖掘的一个基础

然后再上一层我们会通过

这些行为日志的一些处理

去积累用户的行为的特征库

他可能是每天例行化的

然后去算一个时间跨度比较大的

一个历史的一个行为的特征库

会是不断地去丰富和叠加的

它可能是不基于说

我为某一次挖掘标签去产生

它可能是有一些新的行为进来

我们就可以不断地去丰富

这样一个公共的特征库

然后我们还会去考虑有一些

行为预测跟时效性比较相关的

我们也会去建立

它的一个实时的特征

比如说他最近两小时

或者最近刚刚五分钟等等等等

会把这些特征库

逐渐逐渐演变成了一个

历史库和一个实时的库

在计算的时候

我们会根本不同的一个使用场景

把这个两部分的数据做一些融合

然后在做这个特征的时候呢

我们会去在不同的

比如说在标签的应用场景当中

我们需要去做一些特征的选择

然后去看这个特征对每一次的

预测统计是不是

它是一个显著有效的

因为我们的特征库的维度非常多

上百万维

那我怎样在里面找到真正有效的

显著的这样的特征

能真正提高我们模型的一个效果

在这边在库里我们也会去做好

它的监控和它的效果的评估

然后长期的这些开发

我们会把常用的一些特征的一些

处理和生成的这一些的工具

然后把它平台化

它其实和上面一层的算法库的

相当于是说渐渐渐渐已经把这个部分

抽象成通用的工具

然后会放在整个一个平台里面

就是包括一些特征的归一的处理

差值 降维等等一些

经常会用到的一些处理

然后再上一层

我们这边列的是一些

用的比较多的一些算法

这边会有一些

比如说常见的一些分类的算法

然后还有一些文本处理的算法

里面可能有一些是基础的算法

或者是深度的算法

这个在我们公司级别的应用里面

它都已经形成了相应的一些算法平台

然后开发工程师 他其实

每次关注的其实是说

我这次需要去挖掘的

一个目标的重点是什么

然后我可能会在增加特征和抽取特征

花比较多的时间

然后我就会在这个平台里面去尝试

不同的一些模型的对比

然后去把时间花在这个实验

去做上线的一个AB的一些测试

去验证这样一个效果

然后我们可能还需要去

反过来去验证说

我这些特征加进去哪些对它有效

哪些对它来说是可以去除

这个平台里面我们还会涉及到

比如说你样本的抽取

是怎么样一个抽样

是对这个整个的一个分类模型

是有调整意义的

这个在后面的那个实例当中

我会具体地再说一下

所以当中的这两块主要是

特征层和模型层

如果是在

就是我们在线上做AB实验

验证这些就是抽取的标签有效之后呢

我们会把它输出到

不同的上层的应用当中

就像我之前也提到过

就是很多上面的一些实际的算法

比如说像广告算法 推荐算法

它都需要一些精准且大量的

用户侧的这样一些特征

加入到他们的模型当中去验证

有这些标签之后

我们也会去做一些常见的

比如说像用户画像 用户圈人

做一些精准的推送 精准的推销

比如说我上了一部新的就是电影

那它应该是比如说投放给哪些用户

他可能会感兴趣

我可能需要去不同的维度去

比如说去交叉去圈出一些人

比如说他是购买了会员的

他可能是对某一个主题感兴趣的

他可能是最近活跃的

他可能是某一类设备相关的

某一个地域相关的等等等等

各种标签的一个组合

然后他可以做一个交的圈人

去做一个精准的投放

所以就一层呢

是整个的一个标签的

一个输出的一个应用的出口

所以这整个一套呢

是大致的一个用户画像的

一个挖掘的一个流程

大数据技术与应用课程列表:

李国杰:面向大数据的数据科学

-完整讲座

--完整讲座

-李国杰:面向大数据的数据科学--课后习题

吴甘沙:大数据分析师的卓越之道

-数据思维方式的改变

--数据思维方式的改变

-数据的假设与采集

--数据的假设与采集

-数据的准备

--数据的准备

-数据的分析

--数据的分析

-数据的解释与验证

--数据的解释与验证

-吴甘沙:大数据分析师的卓越之道——课后习题

董飞:硅谷公司的大数据实战分析

-个人介绍

--个人介绍

-硅谷热门公司

--硅谷热门公司

-大数据简介

--大数据简介

-大数据平台系统

--大数据平台系统

-工业实践

--工业实践

-结尾

--结尾

-董飞:硅谷公司的大数据实战分析--课后习题

杨光信:数据系统架构

-数据系统架构历史

--数据系统架构历史

-从sql到nosql

--从sql到nosql

-数据库系统实现变革

--数据库系统实现变革

-负载融合

--负载融合

-数据系统架构成本

--数据系统架构成本

-杨光信:数据系统架构——课后习题

时磊:大数据网络可视化

-什么是可视化

--什么是可视化

-网络可视化

--网络可视化

-大数据带来的新挑战

--大数据带来的新挑战

-大数据网络可视化的若干案例

--大数据网络可视化的若干案例

-时磊:大数据网络可视化—— 课后习题

彭元:网络安全与大数据

-网络安全概述

--网络安全概述

-大数据安全分析平台

--大数据安全分析平台

-大数据安全应用

--大数据安全应用

-大数据平台安全

--大数据平台安全

-彭元:网络安全与大数据——课后习题

钟义信:“人工智能与大数据”的创新研究

-人工智能系统的本质功能模型

--人工智能系统的本质功能模型

-隐性智慧,显性智慧

--隐性智慧,显性智慧

-人工智能:能与不能

--人工智能:能与不能

-人工智能的技术现状

--人工智能的技术现状

-机制主义人工智能模型

--机制主义人工智能模型

-信息转换和智能创生定律

--信息转换和智能创生定律

-人工智能与大数据

--人工智能与大数据

-钟义信:“人工智能与大数据”的创新研究——课后习题

吴军:数据为王和机器智能的时代

-什么是机器智能

--什么是机器智能

-大数据的重要性及特点

--大数据的重要性及特点

-大数据中的因果关系与关键技术

--大数据中的因果关系与关键技术

-大数据与机器智能

--大数据与机器智能

-大数据思维

--大数据思维

-讲座问答环节

--讲座问答环节

-吴军:数据为王和机器智能的时代——课后习题

苏中:从大数据到认知计算

-大数据概述

--大数据概述

-大数据相关新趋势

--大数据相关新趋势

-大数据技术创新1

--大数据技术创新1

-大数据技术创新2

--大数据技术创新2

-大数据技术创新3

--大数据技术创新3

-大数据商业价值和前景

--大数据商业价值和前景

-大数据机遇和挑战

--大数据机遇和挑战

-苏中:从大数据到认知计算——课后习题

王新锐:金融大数据的法律实践

-金融大数据概述

--金融大数据概述

-用户个人信息分类

--用户个人信息分类

-金融大数据法律框架

--金融大数据法律框架

-实际案例和业界实践

--实际案例和业界实践

-核心风险点

--核心风险点

-王新锐:金融大数据的法律实践——课后习题

刘鹏:互联网变现与计算广告

-互联网与商业化

--互联网与商业化

-大数据与计算广告

--大数据与计算广告

-计算广告介绍

--计算广告介绍

-数据交易

--数据交易

-刘鹏:互联网变现与计算广告——课后习题

杨保华:区块链与数据科学

-从记账技术到区块链

--从记账技术到区块链

-区块链确保数据真实性

--区块链确保数据真实性

-区块链确保数据安全性

--区块链确保数据安全性

-区块链衡量数据价值

--区块链衡量数据价值

-区块链的应用和总结

--区块链的应用和总结

-杨保华:区块链与数据科学——课后习题

杨紫陌:个性化内容推荐

-个性化推荐系统

--个性化推荐系统

-推荐系统的召回与排序

--推荐系统的召回与排序

-智能制作之个性化海报

--智能制作之个性化海报

-线上推荐系统其它要素

--线上推荐系统其它要素

-杨紫陌:个性化内容推荐——课后习题

陆祁:用户行为大数据

-个人介绍及用户理解背景

--个人介绍及用户理解背景

-用户理解与用户画像

--用户理解与用户画像

-案例1:用户属性识别

--案例1:用户属性识别

-案例2:自然人识别

--案例2:自然人识别

-案例3:WOI与社交关系识别

--案例3:WOI与社交关系识别

-陆祁:用户行为大数据——课后习题

阳任科:大数据与AI的内容分析

-内容智能生态——数据、算法、应用

--内容智能生态——数据、算法、应用

-大数据在内容分析的应用

--大数据在内容分析的应用

-IP价值评估系统

--IP价值评估系统

-爱奇艺的剧本评估

--爱奇艺的剧本评估

-爱奇艺的智能评分

--爱奇艺的智能评分

-阳任科:大数据与AI的内容分析——课后习题

王栋:美团外卖的大数据应用

-外卖行业及场景简介

--外卖行业及场景简介

-餐饮及外卖行业大数据应用框架

--餐饮及外卖行业大数据应用框架

-案例分析:智能营销场景的用户画像

--案例分析:智能营销场景的用户画像

-案例分析:智能助手场景的菜品画像

--案例分析:智能助手场景的菜品画像

-王栋:美团外卖的大数据应用——课后习题

赵楠:商业思维与大数据技术在美团旅行业务中的结合

-旅行业务的特点

--旅行业务的特点

-美团旅行业务的用户画像构建

--美团旅行业务的用户画像构建

-用户画像的应用案例

--用户画像的应用案例

-住宿需求预测问题

--住宿需求预测问题

-营销补贴策略建模

--营销补贴策略建模

-赵楠:商业思维与大数据技术在美团旅行业务中的结合——课后习题

陈彧:美团点评金融服务的大数据与人工智能

-互联网金融背景介绍

--互联网金融背景介绍

-互联网金融科技

--互联网金融科技

-数据智能的三个案例

--数据智能的三个案例

-技术展望

--技术展望

-陈彧:美团点评金融服务的大数据与人工智能——课后习题

毛波:阿里全息大数据构建与应用

-数据的进化历程

--数据的进化历程

-阿里DMP平台介绍

--阿里DMP平台介绍

-核心技术及案例

--核心技术及案例

-数据应用

--数据应用

-毛波:阿里全息大数据构建与应用——课后习题

韩定一:在线营销中的竞价机制与数据价值

-在线营销

--在线营销

-竞价机制

--竞价机制

-数据价值

--数据价值

-韩定一:在线营销中的竞价机制与数据价值——课后习题

龚笔宏:大数据在工业界中的经典案例分享

-竞价排名搜索

--竞价排名搜索

-主要技术问题

--主要技术问题

-点击率预测概述

--点击率预测概述

-点击率预测实践

--点击率预测实践

-龚笔宏:大数据在工业界中的经典案例分享——课后习题

[补充] 郝井华:即时配送中的人工智能

-即时配送业务的背景及挑战

--即时配送业务的背景及挑战

-案例1:订单分配策略

--案例1:订单分配策略

-案例2:供需平衡策略

--案例2:供需平衡策略

-未来展望

--未来展望

-郝井华:即时配送中的人工智能——课后习题

[补充] 陈辉:数据驱动营销

-什么是数据驱动营销

--什么是数据驱动营销

-LTV留存分析

--LTV留存分析

-RFM会员体系

--RFM会员体系

-消费者微群画像

--消费者微群画像

-渠道倾向性分析及行业竞争分析

--渠道倾向性分析及行业竞争分析

-机器学习潜客挖掘模型

-- 机器学习潜客挖掘模型

-陈辉:数据驱动营销——课后习题

[补充] 艾小缤:大数据评价体系在金融、征信领域的创新

-金融大数据时代

--金融大数据时代

-大数据客观信用

--大数据客观信用

-我国的金融环境

--我国的金融环境

-客观信用的实践

--客观信用的实践

-应用案例与成果

--应用案例与成果

-艾小缤:大数据评价体系在金融、征信领域的创新——课后习题

[补充] 郑宇:大数据驱动智能城市

-外部链接

--外部链接

讨论专题

-课程总结讨论单元1/2

-课程讨论总结单元2/2

用户理解与用户画像笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。