大数据系统基础

大数据是一门交叉学科。本门课程重点介绍大数据管理的工具平台、开发环境、基本原理。

开设学校:清华大学;学科:计算机、

大数据系统基础课程:前往报名学习

大数据系统基础视频慕课课程简介:

大数据是一门交叉学科。本门课程重点介绍大数据管理的工具平台、开发环境、基本原理。

前往报名学习

大数据系统基础课程列表:

{{'上次学习:'+learn_list['THU08091000280']['last_leaf_name']}}

1. 绪论

-授课视频

--什么是大数据

--大数据典型应用

--大数据的特点

--大数据技术体系

--大数据生态系统

--大数据技术挑战

--课程内容

-1. 绪论--Quiz 1

2.云计算

-授课视频

--2.1大数据和云计算关系概述

--2.2并行化理念

--2.3规模经济理念

--2.4从仓库规模计算机到云

--2.5云计算商业模式概述

--2.6云计算带来的价值

--2.7云计算的分类

--2.8虚拟化技术概述

--2.9计算虚拟化

--2.10网络虚拟化:基础

--2.11网络虚拟化:软件定义网络

--2.12软件定义网络实现

--2.13存储虚拟化:用户接口

--2.14存储虚拟化:分布式存储实现方式

--2.15虚拟化技术总结

--2.16OPENSTACK

--2.17云计算小结

-2.云计算--Quiz 2

3.文件存储

-授课视频

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

-3.文件存储--Quiz3

4. 处理框架

-授课视频

--4.1大数据的处理框架

--4.2MapReduce编程模型

--MapReduce执行过程

--4.4MapReduce数据流

--4.5MapReduce性能优化与容错

--4.6Hadoop

--4.7MapReduce总结

--4.8Pig Latin

--4.9Pig Latin语法

--4.10Pig Latin 嵌套数据类型

--4.11Pig Latin 实现与优化

--Pig Latin 实现与优化(2)

--4.13类似框架

--4.14章节总结

-4. 处理框架--Quiz4

5.内存计算

-授课视频

--5.1内存计算概述

--5.2并行计算挑战

--5.3并行计算的局限性

--5.4大数据处理并行系统

--5.5内存计算需求

--5.6MapReduce文件传递数据

--5.7内存计算的可行性

--5.8内存层次的延迟

--5.9内存计算实例-spark

--5.10SPARK-RDD

--5.11大数据并行系统

--5.12Spark编程接口

--5.13Spark编程实例——Log挖掘

--5.14Spark编程实例——WorkCount

--5.15Spark实现技术

--5.16复杂的DAG示例

--5.17RDD性能的提高

--5.18Spark应用和生态环境

--5.19Spark的局限性

-5.内存计算--Quiz5

6. NoSQL

-授课视频

--NoSQL与Cassandra

--数据模型、接口、语言

--系统架构与Gossip协议

--一致性哈希与数据分区

--数据副本及一致性

--节点本地数据存储

-6. NoSQL--Quiz6

7. 流计算

-授课视屏

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

-7. 流计算--Quiz7

大数据系统基础开设学校:清华大学

大数据系统基础授课教师:

王建民-教授-清华大学-

王建民博士,1968年生,吉林磐石人,清华大学软件学院教授、博士生导师、院长。国家杰出青年科学基金获得者、国家政府特殊津贴获得者。国家863计划先进制造技术领域“面向制造业的核心软件开发”重大项目总体专家组组长(2012年起)、全国信息安全标准化技术委员会大数据安全标准特别工作组组长(2016年起)、“十二五”国家863计划先进制造领域制造服务技术主题专家组成员、国家卫计委人口健康信息化专家咨询委员会委员(2014年起)、国家“核高基”科技重大专项总体组成员(2008-2013)。2008年以来在IEEE TKDE、VLDBJ、TIP、IEEE TSC、WWWJ等期刊和ACM SIGMOD、VLDB、IEEE ICDE、AAAI、ICML、NIPS、IJCAI、ACM Multimedia、CVPR、ICCV等会议上发表学术论文210余篇;获得中国发明专利授权20余项。2006年入选国家教育部新世纪优秀人才支持计划,同年获得北京市师德先进个人。1998年获国家科技进步二等奖(排名4),2013年入选国家科技部中青年科技领军人才计划,2014年获得国家科技进步二等奖(排名1)。担任ICSOC 2017联合程序主席、WISE 2016联合程序主席、2015-2016年中国计算机学会CCF大数据学术会议联合程序主席。

徐葳-助理教授-清华大学-

研究方向:分布式系统设计、云计算系统设计、大数据分析

陈康-副研究员-清华大学-

清华大学工学博士,副研究员 主要研究方向是信息处理系统、操作系统、存储系统、计算系统虚拟化 参加与主持多个国家863、973以及自然科学基金项目 2014年度电子学会技术发明一等奖 2015年度国家技术发明二等奖

陈文光-教授-清华大学-

主要研究领域为并行计算的编程模型,并行化编译和操作系统

也许你还感兴趣的课程:


  1. 分子医学技术(2021秋)

  2. 数字化产品设计(2021秋)

  3. Chinese Art History(Round 2)

  4. 计算机组织与结构(2021秋)

  5. 民法总则(2021秋)

  6. 程序设计基础(C语言)(2021秋)

  7. 金属材料与热处理(2021秋)

  8. 男装设计(2021秋)

  9. 概率论与数理统计(2021秋)

  10. 大学生需要知道的六件小事儿(2021秋)

  11. 大数据系统基础(2021秋)

  12. 身边的营养学(2021秋)

  13. 组合数学(2021秋)

  14. 图案审美与创作(2021秋)

  15. 模拟电子技术基础(应用部分)(2021秋)

  16. 日语初级(2021秋)

  17. 普通生物学(2021秋)

  18. 汽车发动机原理(2021秋)

  19. 微积分——多元函数与重积分(2021秋)

  20. 信息素养——学术研究的必修课(2021秋)
© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。