高级大数据系统

本课程不仅提供可扩展大数据分布式系统的一般设计原则,还提供了对当今行业中使用的真实系统的大数据处理流程的见解的案例研究。

播放:31644次,课程ID:4233670

高级大数据系统课程简介:前往报名学习

高级大数据系统课程简介:

本课程不仅提供可扩展大数据分布式系统的一般设计原则,还提供了对当今行业中使用的真实系统的大数据处理流程的见解的案例研究。

前往报名学习

高级大数据系统课程目录:

Introduction to Big Data Systems

--What is big data and what is big data system?

--Problems in big data systems?

--Overview of the course

--Principles of big data system design

Basics of Linux Data Processing

--Manipulating Data on Linux

--Running Commands on a Single Machine

--Using a Linux Cluster

Distributed File System

--Storage for Big Data Computing: Distributed file system

--File system and GFS

--Understanding HDFS using Legos

--File System Implementation and DFS

MapReduce

--What is MapReduce and why

--Learn MapReduce by playing with cards

--Processing pattern

--Hadoop

--Algorithms in MapReduce

--Tutorial

In-memory Processing

--Background

--Spark

--Use Spark for data mining

--Spark data processing

--Experiment in Spark

Streaming Data Processing

--Introduction to streaming data processing

--Storm

--Spark streaming

NoSQL

--NoSQL introduction

--Common Advantages

--Bigtable

--Master Startup

--HBase

Graph Processing

--What is GraphDB and Graph data processing

--Graph systems

--Example of a GraphDB

Machine Learning System

--Mahout

--Case Study: Recommendation

--Recommendation in Mahout

期末考试

高级大数据系统授课教师:

王智-副教授-清华大学-深圳研究生院

王智,副教授,开设过《大数据系统基础B》等课程 。2014/2008年分别获清华大学工学博士/学士学位。从事多媒体网络和大数据系统方向研究,包括高性能数据处理系统优化,以及数据驱动的边缘网络、内容分发策略设计。以第一作者发表学术论文20余篇,包括多媒体领域IEEE TMM、ACM TOMCCAP、ACM Multimedia,计算机网络领域IEEE TPDS、IEEE INFOCOM、ACM CoNEXT等。获2014年中国计算机学会(CCF)优秀博士论文奖(排名3/10),ACM Multimedia 2012唯一最佳论文奖,MMM 2015最佳学生论文奖。关键技术获2014腾讯移动互联网创业大赛冠军(第1名),并获得优秀指导老师奖。研究申请专利4项。担任担任期刊中国通信、JCST客座编委。担任ACM Multimedia 2014,IEEE ICC 2014,ACM MMSys 2014,IEEE ICME 2013等会议程序委员会(TPC)成员。

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。