当前课程知识点:商业数据思维与实战 > 第二章 数据思维 > 2.1 数据与数据思维 > 2.1.1 什么是数据
大家好
第二章我们一起来共同学习和探讨
商业数据思维
什么是数据和数据思维
大数据时代
数据思维有哪些新的变革和挑战
数据思维的相关概念和基本理论
是本章的重点内容
而在实际应用中
数据思维有哪些具体的方法
其应用流程是什么样的
我们应该如何运用数据思维
去挖掘商业价值
这是本章的难点内容
好 下面我们来看第一讲
什么是数据
数据是指
对客观事物进行观察和记录的结果
是用来表示客观事物的未经加工的
原始素材
是对客观事物的性质 状态
以及相互关系等进行记载的符号
或这些符号的组合
在计算机和信息科学领域
对数据一词的解释是各种符号
如数字 字母 字符的组合
图形 图像
动画 视频 音频多媒体等
具有一定意义的符号的通称
是客观事物的数量等属性
及其相互关系的抽象表示
按照不同的分类方式
我们可以把数据分为不同的类型
而不同类型的数据
其收集 存储 组织
加工和处理的方式也不一样
如果按照数据类型来划分
我们可以把数据分为文本型数据
数值型数据
时间型数据和逻辑型数据
文本型数据常常用于描述性信息
比如像姓名 地址 商品评论等等
而数值型数据常用于编码
或描述量化信息
比如身份证号 数量 价格等等
时间型数据是用来描述时间的信息
比如像年 月 日 时刻等
而逻辑型数据则是表示
二元逻辑中的是否
真假等状态的逻辑树
通常用0或1来表示
按照结构化程度
我们可以把数据分为结构化数据
半结构化数据和非结构化数据
结构化数据
我们可以用传统的关系型数据库
像oracle SQL server(音)来进行存储
它大多表现为二维表的形式
而半结构化数据是介于结构化
和非结构化数据之间的数据
比如
我们浏览的HTML或XML网页等
其数据结构和内容耦合度高
非结构化数据
比如像图片 图像 音频 视频等
无法在传统的关系型数据库当中
进行存储的数据
可以用(03:53)的
非关系型数据库进行存储
按照数据的加工程度
我们又可以分为
原始数据和衍生数据
原始数据也称为一手数据
它是指
没有经过任何加工处理的数据
但也往往存在着缺失值
噪声或错误等信息的质量问题
衍生数据
是对原始数据进行加工处理后
新产生的数据
按照加工处理的程度
我们又可以分为一次数据
也就是初步预处理和清洗后的
干净数据
二次数据
经过处理和分析的增值数据
三次数据
可用于决策支持的数据
按照数据的封装程度
我们可以分为数据
元数据和数据对象
元数据是用于描述数据的数据
比如在图书情报领域被广泛应用的
都柏林核心元数据
就有效地描述了数字化信息资源的
基本特征和相互关系
而数据对象则是对数据内容
及其元数据进行封装或关联后
得到的更高层次的数据集
按照数据的更新方式
我们又可以分为
批量数据和实时数据
按照颗粒程度我们可以分为
明细数据 汇总数据等等
对于不同类型的数据
和不同的分类方法
我们可以采用不同的
数据处理方法和存储工具
数据和数字 数据和信息
知识之间区别和联系有哪些
数字
我们通常意义上指的是阿拉伯数字
1234567
数字是数据的一种类型
但数据却不一定是数字
比如像我们之前提到的文字
图像 音频等等
它是数据 但不一定是数字
信息是数据的内涵
依赖于数据来表达
数据是信息的表现形式和载体
信息加载于数据之上
对数据作出解释
数据本身没有意义
只有对事物产生影响的时候
才成为信息
而知识则是人对客观事物
运动规律的认识
是人类经验和智慧的总结
也是经过人脑加工处理过的
系统化了的信息
为了更好地了解
相关概念之间的这些区别与联系
我们可以用这样的一张图表
来作出说明
大家首先看到的是一组数字
当然 它也是数据
这些数据反映了商品的编号
商品的销量 商品的均价等等
还有一些我们看到的文字
包括中英文的一些字符
这些反映了商品的类别
品牌的名称
以及市场份额等等
也就是说
在这些表格当中所有的都是数据
第一行 表头 商品的编号
商品类别
这些也是数据吗
像我们刚才提到的
这些关于数据的数据
就是我们所说的元数据
因此
在这张表格当中
所有的都是数据
那信息又在哪儿
通过这些数据的呈现
我们知道了某一个品牌
某一类商品的销售均价
销售额和市场份额
我们也就了解了
关于这一个商品的一条信息
那知识又在哪儿
通过同类商品的比较
我们知道了这个商品的市场份额
和它的变化情况
通过同期数据的比较
我们知道了它变化的比例
销售人员根据这些数据和以往经验
可以制定出广告投放的策略
比如
广告投放的金额是增加还是减少
增加和减少的幅度是多少
这些就是我们的智慧了
我们可以用这样的一个转化关系
来表示数据与信息 知识
乃至智慧之间的关系
我们可以这么理解
数据经过提取就变成了信息
而信息经过加工转化为知识
知识加以应用则变成了智慧
当然 在很多情况下
这些相关概念之间的区别
并不是绝对的
而数据思维
我们是需要完成从数据到信息
再到知识乃至智慧的转化
用数据解决特定的问题
辅助决策支持
好 本讲的知识点
我们就学习到这里
-1.1 数字和数字的产生
--测验1
-1.2 信息、信息技术和信息经济
--测验2
-1.3 数字经济及其特征、发展趋势
--测验3
-1.4 数据伦理
--测验4
-单元测验
-2.1 数据与数据思维
--2.1测验
-2.2 大数据时代的数据思维
--2.2测验
-单元测验
-3.1 大数据时代的商业模式变革
--3.1 测试
-3.2商业数据思维案例分析
-单元测试
-4.1 大数据时代下的统计分析
--4.1 测试
-4.2 数据分析基础
-4.3 统计分析方法专题Ⅰ
--4.3 测试
-单元测试
-5.1 统计分析方法专题Ⅱ
--5.1 测试
-5.2 文本分析
--评论语料
--5.2 测试
-结合从网络中已爬取的商业数据,讨论如何对其中的文本数据进行分析?
-单元测试
-6.1 商业选题
--6.1 测试
-6.2 数据提取
--6.2 测试
-单元测试
-7.1 数据预处理
--7.1 测试
-7.2 数据分析与挖掘
--7.2 测试
-基于对研究数据的预处理结果,讨论如何对其进行进一步的分析与挖掘?
-单元测试
-8.1 数据可视化
--8.1 测试
-8.2 报告撰写
--8.2 测试
-基于对数据不同阶段的处理结果,讨论如何对其进行可视化展示?
-单元测试
-期末考试