当前课程知识点:大数据技术与应用 >  阳任科:大数据与AI的内容分析 >  大数据在内容分析的应用 >  大数据在内容分析的应用

返回《大数据技术与应用》慕课在线视频课程列表

大数据在内容分析的应用在线视频

下一节:IP价值评估系统

返回《大数据技术与应用》慕课在线视频列表

大数据在内容分析的应用课程教案、知识点、字幕

今天本来的计划是讲

我们在投资 。运营和评估

这三个方面给大家做一些介绍

它包括了评估 制作 运营 评价

这样整个链条

由于时间的关系

我不能全部给大家做介绍

可能会找一两个应用服务

给大家做一下介绍

首先 关于评估这一块儿

我们有IP价值评估

IP两个词不是IP地址的IP

这里是知识产权的意思

比如说我们的一部小说

像《无证之罪》

这就是我们的一个IP

或者是某一个小说里面的人物

比如说像孙悟空

它也可以是一个IP

我们需要对它的价值进行评估

剧本评估可能是IP价值评估的子模块

是一个衍生出来的部分

包括小说也一样

因为剧本和小说都可以成为一个IP

这一块儿我后面再跟大家详细讲

这里我就跳过了

第二 跟制作相关比如说像选角

选角对于一些土豪公司

不存在这个问题

我挑最贵的就可以了

对于一些网大网剧

对成本还是有控制的

需要挑一些比较合适的演员

导演 制片人收到的资料挺多的

每天要从这些资料里面

做各种介绍

去挑选合适的演员还是比较困难的

工作量还是比较大的

他用人工挑的话

也缺乏大数据的支持

对于土豪来说可能也存在这个问题

土豪可以挑贵的

但是他不一定能挑到很合适的

比如说他挑范冰冰

范冰冰不一定能够满足

他对剧本用户群的定位

这个数据他不一定可以得到

但是我们大数据可以得到

具体要怎么做呢

我可以稍微给大家概要地讲一下

比如说 我们会有一个知识库

会把所有的演员资料

包括他的各种特征

会放在我们的知识库里面

会根据经纪人递过来的资料

对资料进行识别

抽取一些很关键的特征词

我们会把关键字

跟我们知识库里的演员的标签

计算匹配度

会得到第一轮的一个排序

会得到一个列表

可能有一百个演员

当然可能不会多

可能得到十个演员 会有一个排序

这是第一轮排序

我们的范围从一万个演员里

减少到十个或者到四五十个

第二轮会选择比较合适的演员

满足用户群的定位

这时候我们的大数据

我们的用户画像系统就发挥作用了

针对于我们第一批

挑选出来的这十多个演员

跟用户画像系统相结合

基于用户画像系统的

用户行为数据

会给演员打一个分

进行第二轮排序

获得的结果输出来会挑成更小的子集

比如说挑选四五个演员给到业务方

它的范围大大缩小

以前可能要花一个月

或者两个星期来做这个事情

现在可能花两天就够了

因为范围已经大大小了

这里面会存在几个

比较关键的信息技术点

首先是怎么样从经纪人的

一小段描述性语言里面

或者是一些介绍里面

挑选出一些关键字叫做keywords

跟通常领域的keywords抽取

有一点不太一样

比较经典的像TextRank

像TF-IDF等等

但实际上我们的业务场景

会有一点不一样

因为用户写的描述性的语言

一般都比较短

不太能构成一些统计上的意义

用这种非精度的方式不是特别合适

我们用的是类似于做实体抽取的方式

做实体识别是很经典的场景

做的事情是两个事情

第一是对词的边界进行定位

第二对词进行分类

我们可以看到这个场景

虽然是抽取一个keywords

但跟实体识别的场景还是比较类似的

用了一个深度的模型进行组合

这里面会存在一些细节问题

我们的标注量要足够大

训练语料也要挑选合适的

规模小一点的公司做这个事情

代价还是比较大的

这一块儿稍微给大家讲一下

还有一块儿是剧本拆解

它也是属于IP价值评估的子模块

我们会把剧本按照场景拆解

得到一个现场可以使用的元素

这个场景需要多少内景

多少外景 主要的演员谁

哪些是主要演员 哪些次要演员

用的道具是什么

做完这个工作主要目的

是用于电视剧拍摄时现场进行使用

我们会生成一些顺场表

比如说场务拿着顺场表

可以知道今天这场戏

需要哪些演员过来拍戏

是否需要买盒饭以及盒饭的数量

我需要提前准备什么道具

能够让他们有提前规划

之前没有这样的系统

人工把这个表画出来

人工画表工作量是很大的

需要有一个人对剧本进行通读

提前进行制作

我们现在用机器的方式给做出来

第三 运营相关

比如说用户画像系统

上一个演讲是陆祁

给大家讲得比较详细

主要是讲用户画像这一块

还有绿镜

这个名字不是特别形象

大家现在都用爱奇艺

可以看一下爱奇艺的综艺

最近比较火的是《乐队的夏天》

前段时间比较火的是

《我是唱作人》

大家看到最后下面有一张曲线

曲线就是我们的绿镜曲线

它会标示出哪一段比较精彩

哪一段是高潮 哪一段是低潮

还有一个功能正准备上线

智能倍速功能

根据我们的绿镜曲线作为基础

我们会识别出哪一段

你需要用原速进行播放

哪一段用一点五倍速 二倍速

这是用户可以选择的

我们不能直接规定死

你可以打开个开关

它可以自动帮你略过

相对不精彩的部分

这是给C端 用户可以感受到的

对B端的价值是

比如说《我是唱作人》的导演陈伟

找到我们

他发现有一集收视率稍微低

看到我们的绿镜选项

想让我们帮他分析

到底是哪一块内容不精彩

原因是什么

这是对我们B端(自己)的价值

我们可以还提取一些精彩的片段

我们爱奇艺是一整个内容生态

除了长视频我们还有短视频

我们可以把精彩的片段抽取出来

之后我们可以进行智能拆条

我们有一款好多视频

类似于短视频的

像今日头条这种的

只是我们是偏视频的

可以给我们的产品做广告

我们可以直接把内容

拆解出来推他们

然后向舆情监测这种

这个就是很形象的

大家一看就知道

是对舆情进行分析监控的

还有流量预测

这个事情也比较有意思

我们可以分为

开播前预测和开播后预测

开播前预测是比较难的

举一个例子 去年的时候

一个特别火的剧《延禧攻略》

不知道大家是否注意到

开篇那几集是没有什么贴片广告的

非常干净 到后面突然有贴片广告

对不起

这个事情是我们部门干的

我们告诉他

后面应该找一些广告

原因是

《延禧攻略》是一匹黑马

包括请的演员之前也没流量

也不知道它会火

我们的业务部门

是没有做足准备

没有去谈广告

他觉得这个电视剧不一定会火

我们在开播第一天 第二天

第三天 分别有一个预测

到第三天的时候

我们发现这个流量会成为爆款

提前告诉你

你该去做准备了

应该准备便利贴了

到第七天的时候他们把事情给谈妥了

你会发现后面全是广告

这是我们干的 是为了企业利益

我们的流量预测还是比较准的

这是跟运营相关的事情

另外跟评价相关的事情

我们有热度

热度现在比较火

爱奇艺是首家

把前台播次给关闭的企业

现在我们只会在上面展示热度

这也是响应国家的号召

我们不能以流量标示胜负

所以我们展示的是热度

反映的是近期

某一个视频受欢迎的程度

或者大家关注的程度

还有一个智能评分

现在上得比较好的是电影评分

大家用爱奇艺可以看到

电影频道里

每个电影下面有一个分数

这个分数肯定不是拍脑袋打出来的

也不是一个数学公式搞出来的

之前做这个比较好的是豆瓣

豆瓣跟爱奇艺相比有先天的弱势

它没有用户行为数据

它不是闭环 只是供评论 供打分

真实的用户不会到他那里看影片

爱奇艺是一个在线视频的服务商

用户可以不打分

但是他绝对会留下一些用户行为

你会发现真正打分的用户

占观看用户非常小的部分

十个人里边不一定有一个人打分

打出来的分还打得比较随意

我们有其它用户行为的话

就可以做一些其它的事情了

可能后续也会讲一块

我今天本来至少讲四个

但是好像时间不是特别够

好像就一个小时

我可能就会挑两个内容讲一下

大数据技术与应用课程列表:

李国杰:面向大数据的数据科学

-完整讲座

--完整讲座

-李国杰:面向大数据的数据科学--课后习题

吴甘沙:大数据分析师的卓越之道

-数据思维方式的改变

--数据思维方式的改变

-数据的假设与采集

--数据的假设与采集

-数据的准备

--数据的准备

-数据的分析

--数据的分析

-数据的解释与验证

--数据的解释与验证

-吴甘沙:大数据分析师的卓越之道——课后习题

董飞:硅谷公司的大数据实战分析

-个人介绍

--个人介绍

-硅谷热门公司

--硅谷热门公司

-大数据简介

--大数据简介

-大数据平台系统

--大数据平台系统

-工业实践

--工业实践

-结尾

--结尾

-董飞:硅谷公司的大数据实战分析--课后习题

杨光信:数据系统架构

-数据系统架构历史

--数据系统架构历史

-从sql到nosql

--从sql到nosql

-数据库系统实现变革

--数据库系统实现变革

-负载融合

--负载融合

-数据系统架构成本

--数据系统架构成本

-杨光信:数据系统架构——课后习题

时磊:大数据网络可视化

-什么是可视化

--什么是可视化

-网络可视化

--网络可视化

-大数据带来的新挑战

--大数据带来的新挑战

-大数据网络可视化的若干案例

--大数据网络可视化的若干案例

-时磊:大数据网络可视化—— 课后习题

彭元:网络安全与大数据

-网络安全概述

--网络安全概述

-大数据安全分析平台

--大数据安全分析平台

-大数据安全应用

--大数据安全应用

-大数据平台安全

--大数据平台安全

-彭元:网络安全与大数据——课后习题

钟义信:“人工智能与大数据”的创新研究

-人工智能系统的本质功能模型

--人工智能系统的本质功能模型

-隐性智慧,显性智慧

--隐性智慧,显性智慧

-人工智能:能与不能

--人工智能:能与不能

-人工智能的技术现状

--人工智能的技术现状

-机制主义人工智能模型

--机制主义人工智能模型

-信息转换和智能创生定律

--信息转换和智能创生定律

-人工智能与大数据

--人工智能与大数据

-钟义信:“人工智能与大数据”的创新研究——课后习题

吴军:数据为王和机器智能的时代

-什么是机器智能

--什么是机器智能

-大数据的重要性及特点

--大数据的重要性及特点

-大数据中的因果关系与关键技术

--大数据中的因果关系与关键技术

-大数据与机器智能

--大数据与机器智能

-大数据思维

--大数据思维

-讲座问答环节

--讲座问答环节

-吴军:数据为王和机器智能的时代——课后习题

苏中:从大数据到认知计算

-大数据概述

--大数据概述

-大数据相关新趋势

--大数据相关新趋势

-大数据技术创新1

--大数据技术创新1

-大数据技术创新2

--大数据技术创新2

-大数据技术创新3

--大数据技术创新3

-大数据商业价值和前景

--大数据商业价值和前景

-大数据机遇和挑战

--大数据机遇和挑战

-苏中:从大数据到认知计算——课后习题

王新锐:金融大数据的法律实践

-金融大数据概述

--金融大数据概述

-用户个人信息分类

--用户个人信息分类

-金融大数据法律框架

--金融大数据法律框架

-实际案例和业界实践

--实际案例和业界实践

-核心风险点

--核心风险点

-王新锐:金融大数据的法律实践——课后习题

刘鹏:互联网变现与计算广告

-互联网与商业化

--互联网与商业化

-大数据与计算广告

--大数据与计算广告

-计算广告介绍

--计算广告介绍

-数据交易

--数据交易

-刘鹏:互联网变现与计算广告——课后习题

杨保华:区块链与数据科学

-从记账技术到区块链

--从记账技术到区块链

-区块链确保数据真实性

--区块链确保数据真实性

-区块链确保数据安全性

--区块链确保数据安全性

-区块链衡量数据价值

--区块链衡量数据价值

-区块链的应用和总结

--区块链的应用和总结

-杨保华:区块链与数据科学——课后习题

杨紫陌:个性化内容推荐

-个性化推荐系统

--个性化推荐系统

-推荐系统的召回与排序

--推荐系统的召回与排序

-智能制作之个性化海报

--智能制作之个性化海报

-线上推荐系统其它要素

--线上推荐系统其它要素

-杨紫陌:个性化内容推荐——课后习题

陆祁:用户行为大数据

-个人介绍及用户理解背景

--个人介绍及用户理解背景

-用户理解与用户画像

--用户理解与用户画像

-案例1:用户属性识别

--案例1:用户属性识别

-案例2:自然人识别

--案例2:自然人识别

-案例3:WOI与社交关系识别

--案例3:WOI与社交关系识别

-陆祁:用户行为大数据——课后习题

阳任科:大数据与AI的内容分析

-内容智能生态——数据、算法、应用

--内容智能生态——数据、算法、应用

-大数据在内容分析的应用

--大数据在内容分析的应用

-IP价值评估系统

--IP价值评估系统

-爱奇艺的剧本评估

--爱奇艺的剧本评估

-爱奇艺的智能评分

--爱奇艺的智能评分

-阳任科:大数据与AI的内容分析——课后习题

王栋:美团外卖的大数据应用

-外卖行业及场景简介

--外卖行业及场景简介

-餐饮及外卖行业大数据应用框架

--餐饮及外卖行业大数据应用框架

-案例分析:智能营销场景的用户画像

--案例分析:智能营销场景的用户画像

-案例分析:智能助手场景的菜品画像

--案例分析:智能助手场景的菜品画像

-王栋:美团外卖的大数据应用——课后习题

赵楠:商业思维与大数据技术在美团旅行业务中的结合

-旅行业务的特点

--旅行业务的特点

-美团旅行业务的用户画像构建

--美团旅行业务的用户画像构建

-用户画像的应用案例

--用户画像的应用案例

-住宿需求预测问题

--住宿需求预测问题

-营销补贴策略建模

--营销补贴策略建模

-赵楠:商业思维与大数据技术在美团旅行业务中的结合——课后习题

陈彧:美团点评金融服务的大数据与人工智能

-互联网金融背景介绍

--互联网金融背景介绍

-互联网金融科技

--互联网金融科技

-数据智能的三个案例

--数据智能的三个案例

-技术展望

--技术展望

-陈彧:美团点评金融服务的大数据与人工智能——课后习题

毛波:阿里全息大数据构建与应用

-数据的进化历程

--数据的进化历程

-阿里DMP平台介绍

--阿里DMP平台介绍

-核心技术及案例

--核心技术及案例

-数据应用

--数据应用

-毛波:阿里全息大数据构建与应用——课后习题

韩定一:在线营销中的竞价机制与数据价值

-在线营销

--在线营销

-竞价机制

--竞价机制

-数据价值

--数据价值

-韩定一:在线营销中的竞价机制与数据价值——课后习题

龚笔宏:大数据在工业界中的经典案例分享

-竞价排名搜索

--竞价排名搜索

-主要技术问题

--主要技术问题

-点击率预测概述

--点击率预测概述

-点击率预测实践

--点击率预测实践

-龚笔宏:大数据在工业界中的经典案例分享——课后习题

[补充] 郝井华:即时配送中的人工智能

-即时配送业务的背景及挑战

--即时配送业务的背景及挑战

-案例1:订单分配策略

--案例1:订单分配策略

-案例2:供需平衡策略

--案例2:供需平衡策略

-未来展望

--未来展望

-郝井华:即时配送中的人工智能——课后习题

[补充] 陈辉:数据驱动营销

-什么是数据驱动营销

--什么是数据驱动营销

-LTV留存分析

--LTV留存分析

-RFM会员体系

--RFM会员体系

-消费者微群画像

--消费者微群画像

-渠道倾向性分析及行业竞争分析

--渠道倾向性分析及行业竞争分析

-机器学习潜客挖掘模型

-- 机器学习潜客挖掘模型

-陈辉:数据驱动营销——课后习题

[补充] 艾小缤:大数据评价体系在金融、征信领域的创新

-金融大数据时代

--金融大数据时代

-大数据客观信用

--大数据客观信用

-我国的金融环境

--我国的金融环境

-客观信用的实践

--客观信用的实践

-应用案例与成果

--应用案例与成果

-艾小缤:大数据评价体系在金融、征信领域的创新——课后习题

[补充] 郑宇:大数据驱动智能城市

-外部链接

--外部链接

讨论专题

-课程总结讨论单元1/2

-课程讨论总结单元2/2

大数据在内容分析的应用笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。