大数据系统基础

大数据是一门交叉学科。本门课程重点介绍大数据管理的工具平台、开发环境、基本原理。

开设学校:清华大学;学科:计算机、

大数据系统基础课程:前往报名学习

大数据系统基础视频慕课课程简介:

大数据是一门交叉学科。本门课程重点介绍大数据管理的工具平台、开发环境、基本原理。

前往报名学习

大数据系统基础课程列表:

{{'上次学习:'+learn_list['THU08091000280']['last_leaf_name']}}

1. 绪论

-授课视频

--什么是大数据

--大数据典型应用

--大数据的特点

--大数据技术体系

--大数据生态系统

--大数据技术挑战

--课程内容

-1. 绪论--Quiz 1

2.云计算

-授课视频

--2.1大数据和云计算关系概述

--2.2并行化理念

--2.3规模经济理念

--2.4从仓库规模计算机到云

--2.5云计算商业模式概述

--2.6云计算带来的价值

--2.7云计算的分类

--2.8虚拟化技术概述

--2.9计算虚拟化

--2.10网络虚拟化:基础

--2.11网络虚拟化:软件定义网络

--2.12软件定义网络实现

--2.13存储虚拟化:用户接口

--2.14存储虚拟化:分布式存储实现方式

--2.15虚拟化技术总结

--2.16OPENSTACK

--2.17云计算小结

-2.云计算--Quiz 2

3.文件存储

-授课视频

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

-3.文件存储--Quiz3

4. 处理框架

-授课视频

--4.1大数据的处理框架

--4.2MapReduce编程模型

--MapReduce执行过程

--4.4MapReduce数据流

--4.5MapReduce性能优化与容错

--4.6Hadoop

--4.7MapReduce总结

--4.8Pig Latin

--4.9Pig Latin语法

--4.10Pig Latin 嵌套数据类型

--4.11Pig Latin 实现与优化

--Pig Latin 实现与优化(2)

--4.13类似框架

--4.14章节总结

-4. 处理框架--Quiz4

5.内存计算

-授课视频

--5.1内存计算概述

--5.2并行计算挑战

--5.3并行计算的局限性

--5.4大数据处理并行系统

--5.5内存计算需求

--5.6MapReduce文件传递数据

--5.7内存计算的可行性

--5.8内存层次的延迟

--5.9内存计算实例-spark

--5.10SPARK-RDD

--5.11大数据并行系统

--5.12Spark编程接口

--5.13Spark编程实例——Log挖掘

--5.14Spark编程实例——WorkCount

--5.15Spark实现技术

--5.16复杂的DAG示例

--5.17RDD性能的提高

--5.18Spark应用和生态环境

--5.19Spark的局限性

-5.内存计算--Quiz5

6. NoSQL

-授课视频

--NoSQL与Cassandra

--数据模型、接口、语言

--系统架构与Gossip协议

--一致性哈希与数据分区

--数据副本及一致性

--节点本地数据存储

-6. NoSQL--Quiz6

7. 流计算

-授课视屏

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

--Video

-7. 流计算--Quiz7

大数据系统基础开设学校:清华大学

大数据系统基础授课教师:

王建民-教授-清华大学-

王建民博士,1968年生,吉林磐石人,清华大学软件学院教授、博士生导师、院长。国家杰出青年科学基金获得者、国家政府特殊津贴获得者。国家863计划先进制造技术领域“面向制造业的核心软件开发”重大项目总体专家组组长(2012年起)、全国信息安全标准化技术委员会大数据安全标准特别工作组组长(2016年起)、“十二五”国家863计划先进制造领域制造服务技术主题专家组成员、国家卫计委人口健康信息化专家咨询委员会委员(2014年起)、国家“核高基”科技重大专项总体组成员(2008-2013)。2008年以来在IEEE TKDE、VLDBJ、TIP、IEEE TSC、WWWJ等期刊和ACM SIGMOD、VLDB、IEEE ICDE、AAAI、ICML、NIPS、IJCAI、ACM Multimedia、CVPR、ICCV等会议上发表学术论文210余篇;获得中国发明专利授权20余项。2006年入选国家教育部新世纪优秀人才支持计划,同年获得北京市师德先进个人。1998年获国家科技进步二等奖(排名4),2013年入选国家科技部中青年科技领军人才计划,2014年获得国家科技进步二等奖(排名1)。担任ICSOC 2017联合程序主席、WISE 2016联合程序主席、2015-2016年中国计算机学会CCF大数据学术会议联合程序主席。

徐葳-助理教授-清华大学-

研究方向:分布式系统设计、云计算系统设计、大数据分析

陈康-副研究员-清华大学-

清华大学工学博士,副研究员 主要研究方向是信息处理系统、操作系统、存储系统、计算系统虚拟化 参加与主持多个国家863、973以及自然科学基金项目 2014年度电子学会技术发明一等奖 2015年度国家技术发明二等奖

陈文光-教授-清华大学-

主要研究领域为并行计算的编程模型,并行化编译和操作系统

也许你还感兴趣的课程:


  1. Discovery of China Railway(Round 1)

  2. 母婴护理(2021秋)

  3. 测控电路(2021秋)

  4. Management Consulting(Round 2)

  5. 现代西方哲学认知智慧(2021秋)

  6. Structural Geology(Round 2)

  7. 矩阵分析(下)(2021秋)

  8. A Crash Course in Principles of Microeconomics(Round 2)

  9. Innovation Theory Method & Ecological Civilization Practice(Round 2)

  10. 牙周病学(2021秋)

  11. 大数据系统基础(2021秋)

  12. 身边的营养学(2021秋)

  13. 组合数学(2021秋)

  14. 图案审美与创作(2021秋)

  15. 模拟电子技术基础(应用部分)(2021秋)

  16. 日语初级(2021秋)

  17. 普通生物学(2021秋)

  18. 汽车发动机原理(2021秋)

  19. 微积分——多元函数与重积分(2021秋)

  20. 信息素养——学术研究的必修课(2021秋)
© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。