当前课程知识点：数据挖掘 > 第4章数据仓库和OLAP > 4.3 数据仓库实现 > 4.3 数据仓库实现

返回《数据挖掘》慕课在线视频课程列表

4.3 数据仓库实现在线视频

下一节:数据仓库实现

返回《数据挖掘》慕课在线视频列表

4.3 数据仓库实现课程教案、知识点、字幕

在完成数据仓库模型设计后

可以创建数据仓库

数据仓库系统是一个信息提供平台

从业务处理系统获得数据

并主要以星型模型和

雪花模型进行数据组织

为用户提供把信息加以归纳整理

并及时提供给用户

是数据仓库的根本任务

因此

数据仓库的建设是一个工程

是一个过程

微软公司的SQL Server

可以实现数据仓库

使用SQL Server

实现数据仓库的步骤如下

1 创建Analysis Services项目

2 定义数据源

3 定义数据视图

4 定义多维数据集

下面通过实例

来说明使用SQL Server创建数据仓库

点击文件

新建

新建项目

选择多维和数据挖掘项目

输入项目名称

点击确定

在右侧解决资源管理器中

选择新建数据源

点击新建

此处服务器名选择

sqlserver中连接的服务器名

可以点击右键属性查看

复制

粘贴到此处

数据库选择sqlserver自带的数据库

下一步

模拟信息使用服务账户

确定数据源名称

数据源创建完成

之后创建数据源视图

点击下一步

在创建数据源视图时

需要在源数据库中

指定我们所需要的表或者视图

在本例中我们选择表

点击下一步

确定名称最后完成

可以在创建好的数据源视图中

看到这5张表的关系

很显然是一个雪花型模型

之后对表名做出友好的命名操作

取一个简单的名字

看起来更加简洁一些

之后是维度的设计

点击下一步

使用现有表

这里的主表选择Date表

键列选择默认

点击下一步

选择维度属性

注意在维度设计器中

我们对应的Date表中有属性名称

启用浏览和属性类型可供操作

每一个属性都会有一个属性类型

选择完成之后

点击下一步

最后完成

我们可以右键选择浏览数据

对比一下数据库中的源数据来理解

之后是多维数据集的创建

选择新建多维数据集

使用现有表

InternetSales

作为视图中的表

度量值只选择我们所需要的度量值

点击下一步

最后完成

数据源视图中

可以看到事实表和其它维度表之间

存在着直接或者间接的关系

由于在创建多维数据集时

选择的事实表

只有相关的外键关联到这些维度表

默认情况下

为维度创建了部分的维度属性

我们可以通过拖拽的方式

继续为这些维度添加新的维度属性

再来看这三个维度

Due Date Order Date和Ship Date

最后我们可以部署到

本机查看创建好的多维数据集

数据挖掘课程列表：

第1章概述

-1.1 数据分析与数据挖掘

--1.1 数据分析与数据挖掘

--1.1 数据分析与数据挖掘

-1.2 分析与挖掘的数据类型

--1.2 分析与挖掘的数据类型

-- 1.2 分析与挖掘的数据类型

-1.3 数据分析与数据挖掘的方法

--1.3 数据分析与数据挖掘的方法

-- 1.3 数据分析与数据挖掘的方法

-1.4 数据分析与数据挖掘使用的技术

--1.4 数据分析与数据挖掘使用的技术

--1.4 数据分析与数据挖掘使用的技术

-1.5 应用场景及存在的问题

--1.5 应用场景及存在的问题

-- 1.5 应用场景及存在的问题

-第1章作业1

-第1章作业2

-关于数据分析和数据挖掘的讨论

-关于数据分析与数据挖掘的讨论（研究生班级）

第2章数据

-2.1 数据的属性

--2.1 数据的属性

-- 2.1 数据的属性

-2.2 数据的基本统计描述

--2.2.1 中心趋势度量

--2.2.2 数据分散度量

--2.2.3 数据的图形显示

--2.2 数据的基本统计描述

-2.3 数据的相似性和相异性

--2.3 数据的相似性和相异性

-- 2.3 数据的相似性和相异性

-第2章作业1

-第2章作业2

-关于属性类型的讨论

-关于数据属性的讨论（研究生班级）

第3章数据预处理

-3.1 数据存在的问题

--3.1 数据存在的问题

--数据存在的问题

-3.2 数据清理

--3.2 数据清理

-3.3 数据集成

--3.3 数据集成

-3.4 数据归约

--3.4 数据规约

-3.5 数据变换与数据离散化

--3.5 数据变换与数据离散化

--数据变换与数据离散化

-第3章作业1

-第3章作业2

-关于建立数据集的讨论（研究生班级）

-关于数据预处理的讨论（研究生班级）

-关于建立数据集的讨论（本科生班级）

-关于数据预处理的讨论（本科生班级）

第4章数据仓库和OLAP

-4.1 数据仓库基本概念

--4.1 数据仓库基本概念

--数据仓库基本概念

-4.2 数据仓库设计

--4.2 数据仓库设计

--数据仓库设计

-4.3 数据仓库实现

--4.3 数据仓库实现

--数据仓库实现

-4.4 联机分析处理

--4.4 联机分析处理

--联机分析处理

-4.5 元数据模型

--4.5 元数据模型

--元数据模型

-第4章作业1

-第4章作业2

-关于数据仓库和数据预处理的讨论（本科生班级）

-关于数据仓库价值的讨论（本科生班级）

-关于数据库与数据仓库的讨论（研究生班级）

第5章回归分析

-5.1 回归分析的基本概念

--5.1 回归分析的基本概念

--回归分析的基本概念

-5.2 一元线性回归

--5.2 一元线性回归

--一元线性回归

-5.3 多元线性回归

--5.3 多元线性回归

--多元线性回归

-5.4 多项式回归

--5.4 多项式回归

--多项式回归

-第5章作业1

-第5章作业2

-关于回归预测法的讨论(本科生班级)

-关于回归分析的讨论（研究生班级）

-回归分析的优缺点（研究生班级）

第6章频繁模式

-6.1 概述

--6.1 频繁模式概述

--频繁模式概述

-6.2 Apriori算法

--6.2 Apriori算法

--Apriori算法

-6.3 FP-growth算法

--6.3 FP-growth算法

--FP-growth算法

-6.4 压缩频繁项集

--6.4 压缩频繁项集

--压缩频繁项集

-6.5 关联模式评估

--6.5 关联模式评估

--关联模式评估

-第6章作业1

-第6章作业2

-关于Apriori算法的讨论（本科生班级）

-关于Apriori算法的讨论（研究生班级）

第7章分类

-7.1 分类概述

--7.1 分类概述

-7.2 决策树

--7.2 决策树（上）

--7.2 决策树（中）

--7.2 决策树（下）

-7.3 朴素贝叶斯分类

--7.3 朴素贝叶斯分类

--朴素贝叶斯分类

-7.4 惰性学习法

--7.4 惰性学习法

--7.4 惰性学习法

-7.5 神经网络

--7.5 神经网络（上）

--7.5 神经网络（下）

-7.6 分类模型的评估

--7.6 分类模型的评估（上）

--7.6 分类模型的评估（下）

--分类模型的评估

-第7章第一部分作业2（研究生班级）

-第7章第二部分作业2

-第7章第二部分作业1

-关于分类算法的讨论（本科生班级）

-关于分类算法的讨论（研究生班级）

-关于神经网络的讨论（研究生班级）

第8章聚类

-8.1 聚类概述

--8.1 聚类概述

-8.2 基于划分的聚类

--8.2 基于划分的聚类（一）

--8.2 基于划分的聚类（二）

--基于划分的聚类

-8.3 基于层次的聚类

--8.3 基于层次的聚类

--基于层次的聚类

-8.4 基于密度的聚类

--8.4 基于密度的聚类

--基于密度的聚类

-8.5 基于网格的聚类

--8.5 基于网格的聚类

--基于网格的聚类

-第8章作业1

-第8章作业2

-关于基于划分和基于层次的聚类的讨论（本科生班级）

-关于聚类的讨论（本科生班级）

-关于聚类算法的讨论（研究生班级）

-关于聚类与数据挖掘的讨论（研究生班级）

第9章离群点检测

-9.1 离群点定义与类型

--9.1 离群点定义与类型

--9.1 离群点定义与类型

-9.2 离群点检测

--9.2 离群点检测（一）

--9.2 离群点检测（二）

--离群点检测

-第9章作业1

-第9章作业2

-关于离群点检测的讨论（研究生班级）

4.3 数据仓库实现笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航课程版权归原始院校所有，
本网站仅通过互联网进行慕课课程索引，不提供在线课程学习和视频，请同学们点击报名到课程提供网站进行学习。