当前课程知识点:商业数据思维与实战 > 第四章 大数据时代的统计分析(上) > 4.3 统计分析方法专题Ⅰ > 4.3.3 商业数据描述分析应用案例
大家好
在前面的小节中
我们学习了描述统计分析
及数据的图表展示和概括性度量
本讲我们将学习
如何利用软件实现数据的
描述统计分析
我们以常用的Excel作为分析工具
还是以某公司的电商数据为例
里面有不同的字段
也就是我们所说的变量
如订单ID 订单日期 所在大区
大区经理 销售额 利润
有客户的相关变量
共有9000多条数据
那现在就要考虑从哪些角度
来开展分析
结合已有的数据
我们可以从以下角度进行分析
如果是为了考核大区经理的
销售业绩
就需要从KPI的角度进行分析
可以分析
2019年各大区销售经理的销售业绩
目标的完成情况
还可以从时间维度进行分析
统计近几年
各大区销售变动情况等等
可以进行横向和纵向的对比
如果是想了解用户的信息
可以分析用户的大区分布
客户类型的分布 识别新用户
对客户进行细分
对比分析新老用户的利润占比
分析近几年
不同客户类型的利润变动等等
还可以从产品的角度去分析
例如 对2019年不同产品的销售额
以及占比进行分析
对不同产品的利润以及占比
进行分析
还可以对近几年的销售额
利润的变化趋势进行分析
对未来进行预测分析
我们现在利用Excel
对我们的电商数据进行分析
我们主要从用户的角度来展开分析
当然分析不局限于此
可以从不同的角度进行分析
本次分析
我们主要从四个任务来展开
第一 我们想分析一下
2019年客户类型的分布
例如 客户类型的订单数
他们的利润是什么样的情况
我们点击电商数据
在Excel进行分析的时候
我们通常会用到数据透视表
将全部数据选中以后 点击插入
选取数据透视表
那我会看到这样一个界面
它在下方会问你
选择放置数据透视表的位置
有新工作表或者是现有工作表
我们默认新工作表就可以
点击确定
大家就会看到
生成一个新的工作表
在它的右半部分
会有数据透视表字段的选项
我们想统计一下
2019年不同客户类型的订单数
需要用到订单日期
但是订单日期
我们可以看一下原始数据
它是这样的一个信息
那我们需要做一个简单的处理
我们将订单日期先拖拽到行区域
这样它会自动帮你生成年 季度
那由于我们目前是不需要的
我们可以把它去掉
但去掉以后大家会发现
在我们的数据透视表字段中
会出现年 季度
这在我们后面的分析中会用到
我们把年拽到筛选区域
把不同的客户类型拖到行区域
我们想统计一下不同客户类型
在2019年的订单数
那我们需要把客户类型
再次拖入到值区域
大家就可以看到
生成这样的统计学表格
那我们可以将2019年选中
这就是2019年的订单数
一共有2682条数据
公司消费者小型企业的订单数
分别是这样的一些数据
那我们通过这样的数据透视表
可以快速的进行统计
对于数据透视表
如果要进行改动的话
建议大家把它复制到其他位置
然后我们只粘贴数值的话
在这里面
就可以把一些不必要的一些表达
去掉
例如 我们不叫客户类型
我们通常可以改成叫订单数
这里头也不叫客户行标签
我们叫客户类型
由于时间有限
我们在这里头就不再演示
表格的整理展示
表格 前面我们已经提到
应该整理成三线表格
如果是在商务报告中
大家可以根据自己的情况
给它做一些颜色等等之类的调整
那现在我们再接着看
我们统计完了不同客户类型订单数
我们想看一下不同客户类型
它的利润是什么样一个状况
那我们依然在这个数据透视表中
进行统计
我们可以把计数项拖拽到空白区域
然后我们将利润
拖入到我们的值区域
大家就可以看到表格中
出现了不同公司的利润
那我们可以对这样的数据
进行图形的展示
点击插入
我们选取柱形图
这样就生成了图形
比起表格来说更为直观
但是这些按钮不是应该出现的
我们可以隐藏掉
图表中所有字段按钮
这样看上去比较清晰一些
那汇总 一般我们也可以去掉的
大家在前面已经学过
图表是一定要对它的
纵坐标轴和横坐标轴标注单位
那我们在这里头点击加号
可以增加坐标轴的标题
例如 我们的纵坐标轴
我们就可以写成利润 单位是万元
由于横坐标轴是比较明确的
它是客户的类型
我们可以去掉
然后汇总
我们就要把这个标题给它写上
2019年不同客户类型利润统计
为了更加的美观
有时候需要可以把这些细线
给它去掉
我们的坐标轴
我们可以让它的这个刻度线
在里面进行出现
当然 还可以进一步的美化
例如 我们的消费者占比
我们的消费者的利润是最多的
我们可以给我们的柱进行一下排序
大家可以把这个数值选中
点击降序
这样的话就对柱进行了排序
当然 我们也可以在柱上面
加我们的标签
所以我们在这里面可以点击
数据标签
加进来我们的数字
这样的话
我们的这个图形和表格
由数据透视表就做完了
那接下来我们看我们的第2个任务
2019年各大区客户类型的分布
现在
我们想分析2019年不同大区
客户类型的分布
我们依然采用数据透视表的形式
来进行
全部的数据选中以后点击插入
点选数据透视表
还是生成新的工作表
我们将年选到筛选项
然后不同的大区
也就是大区我们拖拽到行区域
我们想统计不同的客户类型
所以我们需要把客户类型
拖拽到列区域
中间的数值
我们因为想看一下客户类型分布
所以我们需要再次把客户类型
拖到值区域
这样就生成了我们的结果
如果我们想要2019年的数据
我们在这里头点选2019年就可以
但是这个表格中的数据
它是一个绝对数
这样看起来可能不是很方便
如果我们想知道它的占比的情况
那需要我们在计数项这里面
改变一下值字段设置
我们让它的显示方式
采用百分比的形式来进行
大家把这个值显示方式的下拉菜单
点开也会发现有总计的百分比
列和行的百分比
那就需要根据不同的研究的情况
来选是用列 还是用行
还是用总计百分比
如果现在我们想知道东北地区
它内部的一个客户类型的分配比例
那我们就可以用行百分比
大家就可以看到
对于东北地区消费者的占比
占到了53.12%
它的这个公司订单数占到31.44%
如果我们想看一下
总公司的公司订单数里面
各个区所占的比重
那我们就需要用这个列百分比
列汇总百分比
这样的话 我们就可以看出来
在全公司的总的公司订单数里面
东北地区的公司订单数是最多的
然后在消费者订单数里面
东北和华北地区的订单数
是占比较大的比重的
通过这样的方式
我们可以对不同地区的客户类型的
占比进行大体的了解
那接下来我们来看一下
2019年各大区新老用户利润占比
对于这样的问题首先要了解
什么叫新用户
怎么来判断新用户
我们来看一下我们的数据
依然 我们采用数据透视表的形式
让它生成一个新的工作表
我们先来想一下
我们要看2019年新老客户用户订单
而且是不同大区的
那我们需要将我们的大区
先拽到行区域
因为涉及到新老用户
我们是要看客户的ID号
我们同样拽到行区域
如何判断新老用户在2019年
是新用户 是老用户
那你需要先把年给它列到
拖到列区域
因为我们要分析利润
需要把利润拖拽到值区域
这样的初步形成了我们的分析表格
通过表格我们可以看出
2016 2017 2018 2019年
每个大区不同的客户
他们的利润
我们对表格进行简单的整理
在总计中
我们不需要出现总计
所以对行和列的总计禁用
对于每一行分类别的这个总计
也是不需要的
所以在分类汇总点选
不显示分类汇总
我们再把表格进一步的整理一下
让它以表格的形式呈现
这样顾客的ID和东北就分成了两列
但是下方是空白的
我们让它填充进去
所以点选重复所有项目标签
这样的表格看上去就比较美观一些
那我们也可以把这边的符号
进行删除
点选一下按钮
接下来我们就来判断一下
新用户和老用户
对于2019年出现的新用户是指
2016 2017 2018年他没有订单数
这样的客户我们称为新用户
所以我们需要用到我们的IF函数
来进行判断
那如何判断
我们只要看它前面有没有数
它前面如果没有数字
那我们就认为就是一个新用户
如果前面有数那就是老用户
我们可以用COUNT函数
数一下数
2016 2017 2018年
如果这三个它都是为0的
那我们就认为他是一个新用户
否则的话 他就是一个老用户
大家在输入公式的时候一定要记住
是用英文输入模式
我们在这里头是老客户
然后会出现
这样我们就判断出来
他是一个老客户
因为2016年有订单
那变成十字形以后双击
我们的这个公式就全部复制下去了
我们这样对表格
进行了一些整理展示
那现在 我们想统计
不同大区在2019年新老客户的
利润占比
我们需要把数据进行一些复制
因为在原有的这个数据透视表
是无法再生成数据透视表的
所以 我们把我们需要的数据
拷贝出来
复制 然后到一个新的工作表中
我们对表格简单的进行一些修饰
那这个2019年
其实它是指2019年的利润
那就是新老用户
在这个表的基础上
我们再次做数据透视表
把所有的数据全部都选中以后
插入数据透视表
我们让大区 放在行区域中
我们让新老客户放在列区域中
把利润拖到值区域
这样就可以看到不同的大区
新老客户的利润分布情况
那这样看 可能是绝对数
如果想进一步看它的百分比的情况
还同我们刚才一样
我们可以更改一下值字段设置
让它的值显示方式
呈现出是百分比的情况
我们可以用行汇总百分比
来进行展示
大家就可以看到对于东北
华北地区它一般是老客户占比较大
但是对于西北和西南地区来说
它的新客户占比
利润占比还是比较大的
通过这样的表格
我们可以比较清晰的
看出新老客户的利润占比
当然我们也可以绘制图形
来进行直观的展示
那点击插入 对比的条形图
我们可以来进行直观的展示
当然 如果觉得对比的条形图
我们还觉得不是很好的话
大家也可以更改一下我们的图形
我们用 这样子
我们叫堆集的条形图来进行展示
那这样的话
我们可以把我们的这个字段 列表
隐藏掉
这就是我们的不同大区
新老客户的利润占比
当然 我们需要对图形进行一些
必要的说明
例如
坐标轴的标题都代表什么含义
我们的坐标轴是利润占比
横坐标轴我们可以给它去掉
再加上我们的图表的标题
图表标题是
2019年不同大区新老客户
利润占比
这样我们就完成了图形的绘制
通过表和图可以直观的看到
不同大区新老客户利润的情况
那接下来我们再看一下
历年不同客户类型的利润的
变动情况
切换到我们的原始数据
我们再次用数据透视表
生成一个新的工作表
我们想看一下
不同的年中客户类型的利润的
变动情况
所以我们可以将年拖入到行区域
然后我们的客户类型拖拽到列区域
利润放到值区域
这样我们就可以看到
不同的年客户类型的利润的
分布情况
这样不直观
我们最好用图形来进行展示
所以 大家可以点击插入
推荐的图表
我们建议大家用折线图
带数据标记的折线图
可能更好看一些
那这样我们就生成了我们的这个
历年来不同客户类型的利润变动图
同样的道理
我们把按钮
所有字段按钮给它隐藏掉
我们加上我们的坐标轴标题
坐标轴
纵坐标轴是利润
单位是万元
横坐标轴
因为是比较明确的 是年份
所以我们可以不加
那你可以加上图表的标题
可以写2016-2019不同客户类型
不同客户利润变动图
这样我们就完成了图表的绘制
在我们的描述统计中
大家可以多多练习
用Excel中的数据透视表
还有函数等等公式来进行分析
本讲我们主要基于用户角度
展开分析
-1.1 数字和数字的产生
--测验1
-1.2 信息、信息技术和信息经济
--测验2
-1.3 数字经济及其特征、发展趋势
--测验3
-1.4 数据伦理
--测验4
-单元测验
-2.1 数据与数据思维
--2.1测验
-2.2 大数据时代的数据思维
--2.2测验
-单元测验
-3.1 大数据时代的商业模式变革
--3.1 测试
-3.2商业数据思维案例分析
-单元测试
-4.1 大数据时代下的统计分析
--4.1 测试
-4.2 数据分析基础
-4.3 统计分析方法专题Ⅰ
--4.3 测试
-单元测试
-5.1 统计分析方法专题Ⅱ
--5.1 测试
-5.2 文本分析
--评论语料
--5.2 测试
-结合从网络中已爬取的商业数据,讨论如何对其中的文本数据进行分析?
-单元测试
-6.1 商业选题
--6.1 测试
-6.2 数据提取
--6.2 测试
-单元测试
-7.1 数据预处理
--7.1 测试
-7.2 数据分析与挖掘
--7.2 测试
-基于对研究数据的预处理结果,讨论如何对其进行进一步的分析与挖掘?
-单元测试
-8.1 数据可视化
--8.1 测试
-8.2 报告撰写
--8.2 测试
-基于对数据不同阶段的处理结果,讨论如何对其进行可视化展示?
-单元测试
-期末考试