当前课程知识点:大数据技术与应用 > [补充] 陈辉:数据驱动营销 > LTV留存分析 > LTV留存分析
OK
前面讲了一个例子吧
就是告诉大家为什么
通过数据建模来进行营销
是有意义的
因为可以扩大你的投入产出比
然后我们下面会分成六个部分
来详细介绍一下
在阿里巴巴
我们使用了哪些模型
来对我们的消费者进行分析
以及通过这些模型
我们达成了一个什么样的效果
第一部分叫做LTV留存率分析
什么叫做LTV呢
LTV实际上是一个英文词的简写
叫Lifetime Value
什么意思呢
指的是一个用户在一生中
给某个商家带来的价值
这个怎么理解呢
比如说举个例子
那个比如说星巴克这家店
对吧
这家店它是有很多用户的
也有很多人不是他的用户
比如说我可能每个星期
会去一次星巴克的店
然后每次要买30块钱的咖啡
而有些同学可能一个星期去三次
每次买20块钱的咖啡
有些人可能从来没有去过对吧
那这LTV指什么意思呢
指是从现在
或者从我第一次成为
星巴克的用户开始到我死掉
这一辈子在星巴克这家店
买产品花掉的总的金额数 对吧
这个数可能是非常巨大的
就一次我可能只花30块钱
但是如果每个星期都去的话
那这样的话一年是1500吧
假设星巴克和我的关系
维持了十年
就是15000块钱
而有些人去的更频繁
所以他的这个LTV可以更高
而有些人可能是
他就不喜欢喝咖啡
所以他这LTV可能是零
更重要的有些客户
有些人他可能现在不是你的客户
但是有可能通过某种方式
使他转化成你的客户
从而给你带来价值
那所以LTV
这里就是一个简单的公式
叫做创造的价值减去营销成本
什么意思呢
就是创造价值
就刚刚我说那个15000块钱
营销成本是什么呢
就是它在让我成为
由一个不是星巴克的用户
成为一个星巴克用户
中间花的营销的代价
比如说我从来不去星巴克
但是有一天
它给我发了一个马克杯 对吧
这个杯子是100块钱
然后我看了
我觉得它还挺有诚意的
我就去试一下
结果试了一下发现还挺好喝的
所以从此以后
我就成为了星巴克的用户
所以大家看一下
这100块钱的马克杯贵不贵
想起来是挺贵的 对吧
你看因为我去一次只花30块钱
当然30块钱是销售额
它成本可能比如说20块钱
所以只赚
再减去它的那人工费用
可能只赚了三块钱
但它花一百块钱
给我一个马克杯
看起来好像是我要去30次
才能够去把这个马克杯的钱
赚回来
但是长期来看它是赚钱的
因为我本来不是他的用户
我对它来说LTV是零
但他现在花了一百块钱
让我对它的LTV
成为了15000块钱
所以它实际上是赚了14900块钱
所以这个LTV就等于14900块钱
总体来说它是赚钱的
那么这样的一个拉新
它的创造的价值
是远远大于他的成本的
因此是一个good deal
是一个好的一个生意
但是这里面这个一生
好像有点长
这个没准星巴克
三年之后就倒闭了 对吧
或者我三年之后
我就转头另外一个
什么咖啡品牌了
在这个互联网电商环境下
一般来说我们用一个
比较长的一个时间周期
来代替一生
比如说一年的时间
这里指的是
首次成为客户之后一年
如果说我们营销需要一个指标
一个终极的指标
来衡量我们营销的结果
来帮助我们做营销的判断的话
这个指标应该是LTV
什么意思呢
我举两个场景
一个叫做拉新 一个叫做维旧
拉新是什么意思呢
就是我刚才那个行为
就叫被拉新
就是我原来不是一个星巴克客户
现在成为一个星巴克的客户
那么这件事情
这个营销的动作称之为拉新
什么叫做维旧呢
维旧指的是
比如说我已经
是个星巴克的客户了
但是我每天的 不是
每个星期只花30块钱
我希望通过某种方式
来保持这种客户关系
甚至是提升我消费的金额
对吧
比如说给我发一些优惠券
让我更频繁的到星巴克去消费
或者是比如说有一些loyalty program
就是一些积分这样的事情对吧
他可以用这些积分
然后在其它的店铺
来兑换一些产品
所以拉新针对的是
没有成为你的客户之前
让你成为你的客户
而维旧指的是
当他成为你的客户之后
来提高客户的忠诚度
来提高客户的价值
那我们从这两个场景来看
其实LTV会帮助我们做一些决策
比如说这个人要不要拉他
要不要让他成为你的客户对吧
我们可以衡量一下
就是如果我们预测
他在比如一年之内创造的价值
要大于他这次我们push他
那个拉新他的成本的话
我们就应该去做这件事情
如果不行
那比如说如果我们通过预测
这个人就是
天生就不喜欢喝咖啡
一辈子可能不会超过十杯咖啡
对吧
那我们花100块钱的马克杯
去吸引他
这件事情是得不偿失的
第二件事情
就是当拉新预算比较有限的时候
应当优先吸引那些
LTV比较高的客户
什么意思呢
就是这个图里面
比如说这个图告诉我们
说我们要印30万份传单
到五道口去发
但是现在最近经费比较有限
我可能只能印10万份传单
那么这10万份传单
应该优先发给什么人呢
我这表里面可以很清楚的告诉我
应该发给前10层的人 对吧
因为这些人这是一个贪婪问题
对吧
计算机都知道
应该优先发给那些
ROI较高的人
这样的话可以保证
我的总的投入产出比是最高的
同时在维旧里面
也可以使用LTV来做预测
比如说当提升一个老客户的
忠诚度的成本
低于他的忠诚度提高后
带来的营销价值的这个增量
就应该去提升这个客户
比如说我已经是星巴克客户了
他给我再发了一个
100块钱的马克杯
然后让我每个星期
来星巴克的次数
由一次变成了两次
那么这件事情对于商家来说
应该也是那个好算的吧
因为我的一生中
可以给他带来的价值
实际上是远远超过
再加一个马克杯的价值
同时如果当挽留一个
老客户的成本
高于客户能够继续创造的价值
应当放任自流
就是这件事情
可能很多对于所谓的
有些人会说客户是上帝对吧
你是不会让上帝离开你的
但是很多时候
是要作出这个痛苦的决定的
比如说如果你是一个
卖婴幼儿产品的一个商家对吧
如果这个家里的人
他小孩子已经过了那个年纪
他不再需要这个新的这个
比如说尿布或者是奶瓶
那这个时候你再去对他做营销
做广告投放
实际上是没有意义的
因为他人生阶段
已经过了这样一个
需要你的产品的一个阶段
所以应该让他走吧
否则你应该挽留
但是LTV
以LTV作为指标有一个困难
就是LTV是定义成
一个用户一生
给某个商家带来的价值
这一生太长久了
一年也太长久
就很难预测
用户长期的一个购买的行为
即便是做短期预测
甚至是一个
或者三个月的时间
也需要大量的数据
才能够做出
统计上来说比如说
对一半的人来说
是比较有意义这样的预测
那怎么去解决这个模型呢
这里面给大家讲一个花絮
大家阿里巴巴
有一个大数据竞赛
我不知道多少同学听说过没有
叫阿里巴巴大数据竞赛
这个竞赛实际上是每年都有
他跟那个Kaggle比赛差不多
也是有一个是一个
算是一个数学比赛吧
就是会告诉你一堆数据
这些数据主要是
我们淘宝平台上的
一些用户的成交的一些数据
以及这些用户
一些比较基础的一些属性
然后需要你预测一下
比如说给你三个月的数据
需要你预测一下
未来的第四个月
有哪些人会去购买
然后我们会有一个
真实的一个数据的样本
来给你做对比
里面有一个叫
F1分值的一个东西
就是你能把这个分值做的越高
那么你的这个团队就越牛逼
大概是有五千多支队伍参加了
好像是有世界上好多国家
都有人参加
然后最后好像奖金
是100万人民币吧 对
第一名好像是100万人民币
所以这个问题本身是很难的
然后也需要很多
数学的建模的工作
那回到这里
怎么去解决这样一个
LTV难以预测的问题呢
一般来说
我们会用一些比较简化的模型
同时使用多个模型同时预测
来降低这样一个预测的误差
这里给大家举几个
比较容易理解的简单的模型
比如说极简模型
这个什么意思呢
就是每星期的平均收益乘以50
就50指的是一年的
因为我用的是一年的时间周期
50是一年中的那个星期的数目
这个其实就是我刚才说的
我自己那个模型
就是我每个星期花30块钱
喝星巴克的咖啡
然后一年的时间是要乘以50
就是1500块钱
这是第一个模型
第二个模型可以稍微复杂一点
就是我这里涉及到
一个流失率的一个概念
流失率什么意思呢
就是比如说
我第一星期我花了30块钱
但是第二个星期
有可能我会流失掉
因为有些原因吧
比如说我对这个品牌失去了兴趣
或者是有新的品牌吸引我
可能会转化
统计来说我们会统计
比如说100万人里面
平均每个星期会有多少人流失
然后这个模型
就是说我们会把
第一个星期的平均数一除以
1减去每个星期的流失率
大家可以看到
如果流失率越高的话
那实际上这个
不对 这应该是1加
不好意思
如果流失率越高的话
那实际上我的这个分母越大
所以那个我最终的收益
应该是越低的
如果我的流失率是零
什么意思呢
就是这个分母的话就是1
这个公式好像有问题
这个很简单一个公式
就是这个第一个星期的收益率
乘以1加上流失率
再加上流失率的平方
再加上流失率的 不对
1减去流失率
再加上1减流失率的平方
1减安全流失率的二次方三次方
可以计算一下
另外还有更复杂的模型
就是这里假设
每个星期的流失率是一个常数
那它实际上应该不是一个常数
我们发现这个流失率
实际上是有变化的
随着它这个时间的推移
它的流失率有可能是在下降的
这里就是我们
实际上我们在产品里
用到的这个流失率的模型
或者叫一个LTV的模型
叫shifted beta-geometric model
如果大家感兴趣的话
可以搜索一下
就是这是现在工业界用的比较
效果比较好的一个模型
核心的一点就是我们会
我们要预估这个用户
什么时候离开
因为在电商平台上
和一些基于合同的
一些销售不太一样
比如说如果你卖合同的话
是以一年为期的 对吧
你卖出去之后
知道他一年之内
肯定是不会离开的
比如说如果是你的那个
电信的这样一个合同
或者以一个星期
或者以一个月为单位的
但是在很多时候在淘宝平台上
你是没有合同的 对吧
他买了就是买了
他不会说我这一个月都会买
一年都会买
而是说我这次买了就是买了
下次我不知道
所以核心点就在于
预测用户什么时候会死亡
什么时候会
不是说真的死亡
而是说从这个商家这个地方
去彻底的流失掉
具体的这个数学的东西
我就不多说了
大家感兴趣的话
可以去搜索一下
或者我们用更简单的方法
就是当你有很多的数据的时候
你其实不需要建特别复杂的模型
你只要统计一下就好了
对吧 非常简单
就是我们统计了大概3.5亿人
然后这是其中某一个商家的数据
我不能说哪一个商家
但是大家可以看一下
就是根据购买次数的提升
它的这个LTV
实际上在增长的
就是买了一次的时候
我认为LTV是1 假设是1的话
1倍的话
到了2就是一个
比2次稍微多一些
3就比3次稍微多一些
3倍稍微多一些
然后这不是一个线性的关系
就是并不是说买了一次
买了3次就是三分之一的关系
而是说随着你购买的次数的增加
它是有一点指数上升的关系
什么意思呢
就是你买的次数越多的时候
他的客户是越忠诚的
他越不容易离开你的这个商品
然后我们基于这样一个关系
我们发现在这一个商家而言
如果他购买次数
小于等于4的情况下
它是 基本上是一个线性的关系
而大于4的时候
它就产生一个
指数的这样一个跃进的关系
所以我们用4次购买
作为一个分界
当小于等于4的时候
我们认为它是一个新客
这个时候是需要做很多
维系的工作
比如说我们要努力的让他
从一次购买变成二次购买
从二次购买变成三次购买
从三次到四次
而当他购买次数大于等于4的时候
他就成为一个老客
这个时候就不需要
再做更多的这种营销的工作
因为他自己已经对这个品牌
对这样一个产品
有非常好的一个认识
所以它可以自我驱动的
去增长这样一个购买次数
还有这张图就是我刚才说的
为什么说留存率不是一个常数
它是一个变化的量
其实购买次数的增加
它的留存率实际上也是在上升的
这个留存率的话我重新定义一下
就叫做购买
继续购买的概率 什么意思呢
比如说一次购买的留存率
这里是25%
指的是完成一次购买之后的客户
有25%的人继续进行了
第二次购买
换句话说是有75%
四分之三的人
买了一次就离开了
就再也没有购买第二次
这个流失率还是
这个留存率是比较低的
同时这个流失率是蛮高的
但是到了二次之后
一旦发生了第二次购买
他的这个留存率
就提升到了35%
也就是说发生过二次购买的人
继续进行第三次购买的概率
由原来的25%提升到35%
提升了10个百分点
而流失的人由75%降低到了65%
降低了10个百分点
随着购买的次数增加
我发现这个留存率
也是在逐步提升的
等它到这个比如说六次的时候
就提升到了55%
就超过了一半人
会继续购买第七次 第八次
对
这个图的
这个曲线的话
肯定不是无限上升的 对吧
是有一个上限的
它不可能达到110% 对吧
因为他买了之后
最多继续买下去
不会变成1.1个人
这里给出的一个
留存率和LTV的关系
就是留存率这个概念
其实如果大家是做商业的话
会非常关心这样一个概念
就是你的用户
比如说一个月之后
成为你的客户一个月之后
他仍然继续留在你的这个
产品里的这个概率有多大
我们是要努力提升留存率
因为留存率和它的长期的收益
是这样一个
非常强的一个相关的关系
比如说它留存率是25%的时候
它的这个长期的收益是一倍的话
那么到了35%
留存率仅仅提高了10个百分点
但是它的长期的收益就翻了一番
所以说如果你能够让你的客户的
这种忠实度更高一些
高10%的点的话
那么你的这个一年之内的
这个收入可能会提高100%
所以这个曲线是非常惊人的
大家可以发现
特别是到后面的时候
就是非常陡的一个曲线
所以有50%是一个转折点
所以如果大家是将来
比如说搞创业
或者是开自己的
做自己的生意的话
要把这个图记下来
因为可以看到你要努力提高
你客户的留存
因为这可以让你赚更多的钱
同时我们也研究了一下品牌
和留存率和LTV的关系
就是什么叫做
什么叫做品牌的影响力呢
就是比如 比如像对吧
可口快乐
是一个品牌影响力非常大的
这样一个品牌
然后那个王老吉
可能就稍微差一些
而我老家的一个
不知名的一个饮料
比如说露露
可能品牌影响力
当然也很知名了
品牌影响力比较低
我们发现品牌影响力越大
它的留存率越高
这是我们通过研究淘宝的数据
发现留存率越高
留存率越高大家从刚才的图看到
就是LTV是越大的
单个用户的收益也越大 对吧
就是品牌影响力提高10%
留存率提高10%
单个用户的收益就可以提高100%
所以这个影响力很重要的
而品牌影响力大
我们发现另外一个
很有意思的一点
就是商家在单个用户身上
付出的营销成本反而降低
什么意思呢
就是前面的这个图
或者是这个图吧
这个图
就是说当你的购买次数越高
你的品牌知名度越高的情况下
其实你只要付出很小的成本
不需要再去花很大的预算
去维系这样一个客户
就是我们算了一下
大概可能是三分之一
到七分之一的样子
比如同时留住一个老客
和拉一个新客
他的成本可能是一比三
或者一比七这样一个差距
所以大家可以发现品牌影响力
品牌影响力不是一个
可以迅速改变的一个指标对吧
比如说一个品牌
它可能要长期的时间
才能把自己的品牌的知名度提高
同时它也不会迅速的衰减
比如说昨天它是知名的品牌
然后今天又变的默默无闻了
对吧
除非你做了一些疯狂的事情
比如说掺了一些三聚氰氨什么的
你可能第二天
你就把自己的品牌给砸掉了
所以结论就是应当重视品牌建设
这是一个长期的工作
但是它的收益是非常丰厚的
就这个
这样的一个结论
其实很多做营销的人应该都有
就是一个common sense
但是我们是第一次通过我们数据
来发现这样一个规律
而且我们能够告诉你
说你应该花多少钱
通过什么样的手段
去来做你的这种品牌的宣传
然后未来可能产生的收益
是什么样子的
就是我们通过LTV和留存率
这样的模型
达到了这样一个效果
就是在营销里面
永远有两个悖论叫做品和效
什么叫做品
品就是品牌 对吧
你要追求长期的利润
追求长期的影响力
不要只看眼前的东西
而效只是效果
你是所谓效果
就是我要短平快的
去取得一些收益 对吧
这个品和效是一个悖论
但同时我认为
品和效是一个伪命题
品和效其实是一体的
品活效都是效
效是短期的效
而品质是长期的效果
在一个企业发展的不同阶段
其实对品和效的追求是不一样的
所以最开始的阶段
他追求的是效果
因为要生存下去
他用有限的预算 有限的投入
获得尽可能多的产出
这样他的那个企业才能扩大
才能成长
但是当一个企业
真正达到一个规模的时候
处于一个瓶颈的时候
他应该追求他的品牌影响力
然后让他的这个
品牌的影响力更高的情况下
他可以
其实是可以用更低的营销成本
来获得更多的用户
同时它的单个用户身上
能够产生的收益也是可以最大的
-完整讲座
--完整讲座
-李国杰:面向大数据的数据科学--课后习题
-数据思维方式的改变
-数据的假设与采集
--数据的假设与采集
-数据的准备
--数据的准备
-数据的分析
--数据的分析
-数据的解释与验证
--数据的解释与验证
-吴甘沙:大数据分析师的卓越之道——课后习题
-个人介绍
--个人介绍
-硅谷热门公司
--硅谷热门公司
-大数据简介
--大数据简介
-大数据平台系统
--大数据平台系统
-工业实践
--工业实践
-结尾
--结尾
-董飞:硅谷公司的大数据实战分析--课后习题
-数据系统架构历史
--数据系统架构历史
-从sql到nosql
-数据库系统实现变革
-负载融合
--负载融合
-数据系统架构成本
--数据系统架构成本
-杨光信:数据系统架构——课后习题
-什么是可视化
--什么是可视化
-网络可视化
--网络可视化
-大数据带来的新挑战
-大数据网络可视化的若干案例
-时磊:大数据网络可视化—— 课后习题
-网络安全概述
--网络安全概述
-大数据安全分析平台
-大数据安全应用
--大数据安全应用
-大数据平台安全
--大数据平台安全
-彭元:网络安全与大数据——课后习题
-人工智能系统的本质功能模型
-隐性智慧,显性智慧
-人工智能:能与不能
-人工智能的技术现状
-机制主义人工智能模型
-信息转换和智能创生定律
-人工智能与大数据
--人工智能与大数据
-钟义信:“人工智能与大数据”的创新研究——课后习题
-什么是机器智能
--什么是机器智能
-大数据的重要性及特点
-大数据中的因果关系与关键技术
-大数据与机器智能
--大数据与机器智能
-大数据思维
--大数据思维
-讲座问答环节
--讲座问答环节
-吴军:数据为王和机器智能的时代——课后习题
-大数据概述
--大数据概述
-大数据相关新趋势
--大数据相关新趋势
-大数据技术创新1
--大数据技术创新1
-大数据技术创新2
--大数据技术创新2
-大数据技术创新3
--大数据技术创新3
-大数据商业价值和前景
-大数据机遇和挑战
--大数据机遇和挑战
-苏中:从大数据到认知计算——课后习题
-金融大数据概述
--金融大数据概述
-用户个人信息分类
--用户个人信息分类
-金融大数据法律框架
-实际案例和业界实践
-核心风险点
--核心风险点
-王新锐:金融大数据的法律实践——课后习题
-互联网与商业化
--互联网与商业化
-大数据与计算广告
--大数据与计算广告
-计算广告介绍
--计算广告介绍
-数据交易
--数据交易
-刘鹏:互联网变现与计算广告——课后习题
-从记账技术到区块链
-区块链确保数据真实性
-区块链确保数据安全性
-区块链衡量数据价值
-区块链的应用和总结
-杨保华:区块链与数据科学——课后习题
-个性化推荐系统
--个性化推荐系统
-推荐系统的召回与排序
-智能制作之个性化海报
-线上推荐系统其它要素
-杨紫陌:个性化内容推荐——课后习题
-个人介绍及用户理解背景
-用户理解与用户画像
-案例1:用户属性识别
-案例2:自然人识别
-案例3:WOI与社交关系识别
-陆祁:用户行为大数据——课后习题
-内容智能生态——数据、算法、应用
-大数据在内容分析的应用
-IP价值评估系统
--IP价值评估系统
-爱奇艺的剧本评估
--爱奇艺的剧本评估
-爱奇艺的智能评分
--爱奇艺的智能评分
-阳任科:大数据与AI的内容分析——课后习题
-外卖行业及场景简介
-餐饮及外卖行业大数据应用框架
-案例分析:智能营销场景的用户画像
-案例分析:智能助手场景的菜品画像
-王栋:美团外卖的大数据应用——课后习题
-旅行业务的特点
--旅行业务的特点
-美团旅行业务的用户画像构建
-用户画像的应用案例
-住宿需求预测问题
--住宿需求预测问题
-营销补贴策略建模
--营销补贴策略建模
-赵楠:商业思维与大数据技术在美团旅行业务中的结合——课后习题
-互联网金融背景介绍
-互联网金融科技
--互联网金融科技
-数据智能的三个案例
-技术展望
--技术展望
-陈彧:美团点评金融服务的大数据与人工智能——课后习题
-数据的进化历程
--数据的进化历程
-阿里DMP平台介绍
-核心技术及案例
--核心技术及案例
-数据应用
--数据应用
-毛波:阿里全息大数据构建与应用——课后习题
-在线营销
--在线营销
-竞价机制
--竞价机制
-数据价值
--数据价值
-韩定一:在线营销中的竞价机制与数据价值——课后习题
-竞价排名搜索
--竞价排名搜索
-主要技术问题
--主要技术问题
-点击率预测概述
--点击率预测概述
-点击率预测实践
--点击率预测实践
-龚笔宏:大数据在工业界中的经典案例分享——课后习题
-即时配送业务的背景及挑战
-案例1:订单分配策略
-案例2:供需平衡策略
-未来展望
--未来展望
-郝井华:即时配送中的人工智能——课后习题
-什么是数据驱动营销
-LTV留存分析
--LTV留存分析
-RFM会员体系
--RFM会员体系
-消费者微群画像
--消费者微群画像
-渠道倾向性分析及行业竞争分析
-机器学习潜客挖掘模型
-- 机器学习潜客挖掘模型
-陈辉:数据驱动营销——课后习题
-金融大数据时代
--金融大数据时代
-大数据客观信用
--大数据客观信用
-我国的金融环境
--我国的金融环境
-客观信用的实践
--客观信用的实践
-应用案例与成果
--应用案例与成果
-艾小缤:大数据评价体系在金融、征信领域的创新——课后习题
-外部链接
--外部链接