当前课程知识点:大数据技术与应用 >  赵楠:商业思维与大数据技术在美团旅行业务中的结合 >  住宿需求预测问题 >  住宿需求预测问题

返回《大数据技术与应用》慕课在线视频课程列表

住宿需求预测问题在线视频

下一节:营销补贴策略建模

返回《大数据技术与应用》慕课在线视频列表

住宿需求预测问题课程教案、知识点、字幕

好 那前面讲了很多

都是这个在讲用户画像这件事情

那接下来再讲下面一个主题

就是我们在做这种预测这件事情

那首先还是先回答一下说

为什么要做这件事情

那这个和刚才我们讲到的

行业的特点有很大的关系

就是第一是在酒店这一端

他的这个供给有限

刚才也讲了总共全国

只有1200万的客房

而且在部分的时间 部分的地点

库存会非常的紧张

我给大家讲一下

今年五一在天津发生了什么事情

就是从我们的这个平台上

我们可以看到说

一个平时大概

差不多两三百块钱的一个酒店

在那一天能够卖到八九百

而且是瞬间被抢走

然后这个我们认为这个

平时在平台上

这个两三千的酒店已经很贵了

你会发现这个酒店

只要这个一放出来

立刻就被人抢走

然后这个发生了什么事呢

后来我们看了一下才发现说

第一当然肯定是那个

五一的这个假期嘛

第二是那个五月天

在天津开了一场

连开了两天吧还是三天的演唱会

所以这个我们就感慨说

这个明星的号召力真的是巨大的

所以你就可以想象说

在那个时间在那个时间点上

这个真的是能够

整个天津做到一房难求

所以这个就是在整个供给上

其实面临一个很大的一个

这种压力

就是大家会面临

这种库存紧张的情况

然后在用户这一端也会

也会有一些问题

就是刚才讲我们的用户呢

是这种比较年轻的比较多

那年轻人的这种特点是什么呢

年轻人的特点是这个比较随性

就是大家不太做这种计划性

就是我们看到我们平台上的

这些用户

大概80%的用户

他们会当天才去定当天的酒店

所以这件事情这个

甚至是什么呢

甚至很多用户

他们在出国玩的时候

也是到了目的地的时候

才去定酒店

这个事对于像我这种

这个中年人来说

就简直是不可理解的

因为我如果要是出差的话

我基本上会至少提前一周

就把这个机票酒店全定好

这样心里才踏实

那这个问题在于什么

就是因为用户到了

这个最后一分钟的时候

他才想到说要去定这个酒店

但是如果这时候

本身如果我不知道

用户有这个需求

那么我提前没有给用户

留够足够的这个库存的话

那么用户来这个平台就会发现

他找不到他所要的商品

那这时候他就会选择放弃

这个平台

所以对我来讲

其实这个预测这件事情

对于整个这个业务来说

就显得非常的重要

好 那对于这个预测来说

我们怎么来做这个事儿呢

简单来说其实分成这么几部分

第一就是你要去获取更多的信息

对吧

我们能够拿到这个历史的信息

能拿到未来的这种信息

我们拿到内部的数据

以及外部的数据

那么方法上其实是

相对比较经典的一些

统计学的方法量化的方法

包括现在大家都在用的

机器学习的一些方法

但是在这里面我想强调的是说

其实我们在这里面

结合了很多一些

这个业务上的创新

那么这个具体作用当中

会有什么样一些这种难点呢

这里也跟大家去进行一个分享

就是首先第一个是这个

就是我们在做预测的时候

其实很多时候

我们都在用历史的数据

来去指导未来

但是我们现在面临的一个问题是说

我们的历史数据本身是失真的

就是它的这个可信度是有问题的

这个为什么这么讲呢

我给大家举个例子

就是比如说如果我看一个酒店

比如在上周的时候

他卖出去了10个间夜

卖出了10间房

那么我们是不是认为那一天

真正只有10个人有这个需求呢

其实不是的

可能在他一天

我只从酒店那边

拿到了十个库存

那也就是说

如果我没有库存限制的话

可能那一天

我能有20或者30个间夜

能够卖出去

所以那这个就说明什么

说明我们以往的一个

历史的数据本身

实际上和真实的这种需求之间

是有偏差的

这个里面我就需要去做

相应一些这种 需求的还原

那这件事情就是对于我们来讲

我们如果没有发现

这个问题的话

那么我们其实在用再这个先进

再科学的这种预测模型

你再不断的再去调用

你会发现这个事情是徒劳的

因为你本身用的数据本身

其实是有问题的

所以这个就是我觉得

也非常证明了一点

就是说你在做这件事情的时候

你真的要理解一个业务的特点

那么我们为什么在历史上

这个数据会是这样子

那么它是有一些业务的

这种场景在里面的

那第二个难点是什么

第二个难点就是我们影响

最后结果的因素是相对比较多的

无论是我们的这种用户

还是这个酒店

还是我们的竞争对手

还是我们刚才讲到

像一些外部的事件对吧

演唱会 等等

像这一些事件

其实它都会去影响我的结果

那么第三个是什么呢

第三个就是这个很好理解

从整体上如果我想去做一些

这种趋势的判断预测的话

这个事情相对来说会比较简单

但如果你想细到某一个个体

去做预测

这个事情的难度会非常的大

这个就给大家举个例子就是说

你比如让你现在去预测

明天的这个上证指数是多少

我估计大家可能基于历史

过去几天的数据这个情况

大家拍也能拍的差不多

不会偏差太大

但是现在让你去预测

上证里面的几十支股票

每支股票的这种涨幅跌幅

我觉得这件事情就会变得非常的难

其实同样的道理 对吧

每一个个体的这种波动会非常大

但是整体放到一起

可能这个波动会小

但是对于我们来讲

我们要把这个预测

做到一个非常细的力度

这个会对于整个

我们的这种挑战会非常大

好 那有了这样一些挑战

我们怎么去解决这样一些问题呢

就是我们大概其实做这样三件事

第一就是历史需求的还原

第二是未来的预测

第三是把这个预测能够拆分到SKU

这里我分别给大家去介绍一下

首先是历史需求的还原

这个刚才就讲说

我怎么能够知道这个历史上

如果没有这个库存约束的话

我大概能够卖多少

那么用一些简单的方法

比如说按照这个售卖时间

算这个占比 对吧

我推测一下全天大概会卖多少

或者是按照它历史的这个情况

某一个这个SKU

它历史卖的情况我去推测

但其实真正我发现

这些其实都会有问题

就是为什么

因为对于单个的这个SKU来说

其实它的这种波动会非常的大

那我们怎么去解决这个问题

那我们其实还是回归到说

用户的这种需求

就是到底用户想要的是什么

那我们可以想象一下就是说

其实一个用户来说

他其实去选择一个这种酒店

他实际上选择的是什么

他选择的是在某一个区域里面

选择某一个档次的酒店

那也就是说就是除了有个别

非常少的用户

他可能只认准某一个

或某几个酒店的品牌

其实绝大部分的用户

他是一个觉得说

只要符合我的这个价格档位

我能够去接受就OK的

那这样的话就给我们的

一个启发就是说

我不能只以某一个

单个的SKU来去考虑

我怎么去这个

看我的这个预定的进度

而是我要去把整个

同这个区域里面

同等级的酒店

来去建立这样一个模型

来去对我历史的数据

去进行一个这种还原

所以这个就是我们在这块

这个结合业务的情况

结合真正的那种需求

我们来做的这样一些这种方法

那么第二个事

就是我们来做这个

这个间夜的这个预测

那这个预测呢

我们其实也用过

很多一些这种方法

时间序列呀 回归呀

我们都用过

但是其实效果都不是特别的好

所以最终我们用的是什么呢

我们用的是这个

就是xgboost的一个模型

但是这里面我想讲的是什么呢

就是这个模型其实相对来说

是比较通用的

大家都可以去用

但是真正影响这个模型的呢

实际上是你能不能找到

真正的这种模型的特征

就是你能不能把更多有效的输入

给到这个模型

那在这件事情上

我们的一个思考就是

以往大家其实在做预测的时候

更多的是基于历史的数据

那么基于历史的数据去预测未来

但是对于我们来讲呢

其实我们看到

我们其实能够拿到一些未来的数据

什么叫未来的数据

举个例子来说

如果是在这个十一黄金周

那么基本上我们看到

在提前20天到提前一个月的时候

就已经开始有用户

开始去查询十一那段时间的

一些这种酒店呀 机票等等

这样一些信息了

这表示什么

这表示其实用户是明显

有这个需求的

所以我们所做的事情就是

我们把用户对于未来的查询

以及这种交易下单的

这样一些这种数据

把它引入到我们对未来的

一个预测里面

那么因为这个数据

它相比于历史的数据

可能它的这种准确性会更高

更能反应今年的

真正的这样一个趋势

所以引入这部分之后

整个我们的这个模型的

这种精准度会大大的提升

所以真的从最后的效果来看

也确实就是我们现在也不断的

在把未来的一些这种数据

能够引入进来

能够这个提升

我们这样一种准确度

然后第三个事情

给大家分享的是

我们在做的这个叫

这个预测结果的拆分的SKU

这个是什么意思呢

就是我们目前在做的

这样一种预测呢

我们是按照这个poi维度

就是我们叫poi

其实就是某一个酒店的这个维度

我们预测酒店未来某一天

大概会有多少的产量

但是真正大家想一下

用户去定酒店的时候

实际上定的具体的SKU

也就是他定的到底是一个标准间

是一个大床 还是一个总统套

对吧

这个他选的是具体的一个SKU

那这里面就存在一个问题

我需要把从poi的这个结果

能够拆分到SKU去

大家可能会有一个问题说

那你为啥不直接去预测SKU呢

这个我也想这么干

但是问题在于说SKU的这个

这个数据量会更加的稀疏

就使得说我整个的模型

是没有办法去进行训练的

所以我们只能做的是说

现阶段我们通过对整个

整体的poi去进行预测

预测完之后

我们把这个通过人工的方式

进行这种拆解

但是这个拆的过程中

其实我们也用到了这个

就是贝叶斯的一些这种思想

去进行这个后验

这个什么意思呢就是说

可能在最开始起始点的时候

我会按照我的一个大概的判断

会对整个一个酒店下面

不同的SKU之间的比例有一个划分

分完之后的话

这是我的一个预测值

那么到第二天的时候

实际上会有一个实际值

实际值的时候

会跟预测之间会有一个偏差

那么有了这个偏差之后的话

我就会把这个偏差的值

迭代到下一次的这个

在这个拆分过程中

这样的话不断的去迭代

去修正我的这样一种偏差

那通过这个方式的话

那个基本上我们现在通过

这样一种人工的模型

我们通过这种模型的方式

来去把这个拆分做的精准度

应该说从整个的应用的结果来看

还是相对比较的这个好的

这个结果

好 那刚才讲的是第二个

跟大家分享的这个例子是这个预测

大数据技术与应用课程列表:

李国杰:面向大数据的数据科学

-完整讲座

--完整讲座

-李国杰:面向大数据的数据科学--课后习题

吴甘沙:大数据分析师的卓越之道

-数据思维方式的改变

--数据思维方式的改变

-数据的假设与采集

--数据的假设与采集

-数据的准备

--数据的准备

-数据的分析

--数据的分析

-数据的解释与验证

--数据的解释与验证

-吴甘沙:大数据分析师的卓越之道——课后习题

董飞:硅谷公司的大数据实战分析

-个人介绍

--个人介绍

-硅谷热门公司

--硅谷热门公司

-大数据简介

--大数据简介

-大数据平台系统

--大数据平台系统

-工业实践

--工业实践

-结尾

--结尾

-董飞:硅谷公司的大数据实战分析--课后习题

杨光信:数据系统架构

-数据系统架构历史

--数据系统架构历史

-从sql到nosql

--从sql到nosql

-数据库系统实现变革

--数据库系统实现变革

-负载融合

--负载融合

-数据系统架构成本

--数据系统架构成本

-杨光信:数据系统架构——课后习题

时磊:大数据网络可视化

-什么是可视化

--什么是可视化

-网络可视化

--网络可视化

-大数据带来的新挑战

--大数据带来的新挑战

-大数据网络可视化的若干案例

--大数据网络可视化的若干案例

-时磊:大数据网络可视化—— 课后习题

彭元:网络安全与大数据

-网络安全概述

--网络安全概述

-大数据安全分析平台

--大数据安全分析平台

-大数据安全应用

--大数据安全应用

-大数据平台安全

--大数据平台安全

-彭元:网络安全与大数据——课后习题

钟义信:“人工智能与大数据”的创新研究

-人工智能系统的本质功能模型

--人工智能系统的本质功能模型

-隐性智慧,显性智慧

--隐性智慧,显性智慧

-人工智能:能与不能

--人工智能:能与不能

-人工智能的技术现状

--人工智能的技术现状

-机制主义人工智能模型

--机制主义人工智能模型

-信息转换和智能创生定律

--信息转换和智能创生定律

-人工智能与大数据

--人工智能与大数据

-钟义信:“人工智能与大数据”的创新研究——课后习题

吴军:数据为王和机器智能的时代

-什么是机器智能

--什么是机器智能

-大数据的重要性及特点

--大数据的重要性及特点

-大数据中的因果关系与关键技术

--大数据中的因果关系与关键技术

-大数据与机器智能

--大数据与机器智能

-大数据思维

--大数据思维

-讲座问答环节

--讲座问答环节

-吴军:数据为王和机器智能的时代——课后习题

苏中:从大数据到认知计算

-大数据概述

--大数据概述

-大数据相关新趋势

--大数据相关新趋势

-大数据技术创新1

--大数据技术创新1

-大数据技术创新2

--大数据技术创新2

-大数据技术创新3

--大数据技术创新3

-大数据商业价值和前景

--大数据商业价值和前景

-大数据机遇和挑战

--大数据机遇和挑战

-苏中:从大数据到认知计算——课后习题

王新锐:金融大数据的法律实践

-金融大数据概述

--金融大数据概述

-用户个人信息分类

--用户个人信息分类

-金融大数据法律框架

--金融大数据法律框架

-实际案例和业界实践

--实际案例和业界实践

-核心风险点

--核心风险点

-王新锐:金融大数据的法律实践——课后习题

刘鹏:互联网变现与计算广告

-互联网与商业化

--互联网与商业化

-大数据与计算广告

--大数据与计算广告

-计算广告介绍

--计算广告介绍

-数据交易

--数据交易

-刘鹏:互联网变现与计算广告——课后习题

杨保华:区块链与数据科学

-从记账技术到区块链

--从记账技术到区块链

-区块链确保数据真实性

--区块链确保数据真实性

-区块链确保数据安全性

--区块链确保数据安全性

-区块链衡量数据价值

--区块链衡量数据价值

-区块链的应用和总结

--区块链的应用和总结

-杨保华:区块链与数据科学——课后习题

杨紫陌:个性化内容推荐

-个性化推荐系统

--个性化推荐系统

-推荐系统的召回与排序

--推荐系统的召回与排序

-智能制作之个性化海报

--智能制作之个性化海报

-线上推荐系统其它要素

--线上推荐系统其它要素

-杨紫陌:个性化内容推荐——课后习题

陆祁:用户行为大数据

-个人介绍及用户理解背景

--个人介绍及用户理解背景

-用户理解与用户画像

--用户理解与用户画像

-案例1:用户属性识别

--案例1:用户属性识别

-案例2:自然人识别

--案例2:自然人识别

-案例3:WOI与社交关系识别

--案例3:WOI与社交关系识别

-陆祁:用户行为大数据——课后习题

阳任科:大数据与AI的内容分析

-内容智能生态——数据、算法、应用

--内容智能生态——数据、算法、应用

-大数据在内容分析的应用

--大数据在内容分析的应用

-IP价值评估系统

--IP价值评估系统

-爱奇艺的剧本评估

--爱奇艺的剧本评估

-爱奇艺的智能评分

--爱奇艺的智能评分

-阳任科:大数据与AI的内容分析——课后习题

王栋:美团外卖的大数据应用

-外卖行业及场景简介

--外卖行业及场景简介

-餐饮及外卖行业大数据应用框架

--餐饮及外卖行业大数据应用框架

-案例分析:智能营销场景的用户画像

--案例分析:智能营销场景的用户画像

-案例分析:智能助手场景的菜品画像

--案例分析:智能助手场景的菜品画像

-王栋:美团外卖的大数据应用——课后习题

赵楠:商业思维与大数据技术在美团旅行业务中的结合

-旅行业务的特点

--旅行业务的特点

-美团旅行业务的用户画像构建

--美团旅行业务的用户画像构建

-用户画像的应用案例

--用户画像的应用案例

-住宿需求预测问题

--住宿需求预测问题

-营销补贴策略建模

--营销补贴策略建模

-赵楠:商业思维与大数据技术在美团旅行业务中的结合——课后习题

陈彧:美团点评金融服务的大数据与人工智能

-互联网金融背景介绍

--互联网金融背景介绍

-互联网金融科技

--互联网金融科技

-数据智能的三个案例

--数据智能的三个案例

-技术展望

--技术展望

-陈彧:美团点评金融服务的大数据与人工智能——课后习题

毛波:阿里全息大数据构建与应用

-数据的进化历程

--数据的进化历程

-阿里DMP平台介绍

--阿里DMP平台介绍

-核心技术及案例

--核心技术及案例

-数据应用

--数据应用

-毛波:阿里全息大数据构建与应用——课后习题

韩定一:在线营销中的竞价机制与数据价值

-在线营销

--在线营销

-竞价机制

--竞价机制

-数据价值

--数据价值

-韩定一:在线营销中的竞价机制与数据价值——课后习题

龚笔宏:大数据在工业界中的经典案例分享

-竞价排名搜索

--竞价排名搜索

-主要技术问题

--主要技术问题

-点击率预测概述

--点击率预测概述

-点击率预测实践

--点击率预测实践

-龚笔宏:大数据在工业界中的经典案例分享——课后习题

[补充] 郝井华:即时配送中的人工智能

-即时配送业务的背景及挑战

--即时配送业务的背景及挑战

-案例1:订单分配策略

--案例1:订单分配策略

-案例2:供需平衡策略

--案例2:供需平衡策略

-未来展望

--未来展望

-郝井华:即时配送中的人工智能——课后习题

[补充] 陈辉:数据驱动营销

-什么是数据驱动营销

--什么是数据驱动营销

-LTV留存分析

--LTV留存分析

-RFM会员体系

--RFM会员体系

-消费者微群画像

--消费者微群画像

-渠道倾向性分析及行业竞争分析

--渠道倾向性分析及行业竞争分析

-机器学习潜客挖掘模型

-- 机器学习潜客挖掘模型

-陈辉:数据驱动营销——课后习题

[补充] 艾小缤:大数据评价体系在金融、征信领域的创新

-金融大数据时代

--金融大数据时代

-大数据客观信用

--大数据客观信用

-我国的金融环境

--我国的金融环境

-客观信用的实践

--客观信用的实践

-应用案例与成果

--应用案例与成果

-艾小缤:大数据评价体系在金融、征信领域的创新——课后习题

[补充] 郑宇:大数据驱动智能城市

-外部链接

--外部链接

讨论专题

-课程总结讨论单元1/2

-课程讨论总结单元2/2

住宿需求预测问题笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。