“这门课程涵盖了互联网搜索、城市计算、社会计算、软件分析、可视化等大数据研究中的热门和前沿领域,课程设计兼具前所未有的广度和深度,我真诚地推荐所有对大数据研究感兴趣的同学去学习这门课程。
开设学校:Microsoft;学科:计算机、
“这门课程涵盖了互联网搜索、城市计算、社会计算、软件分析、可视化等大数据研究中的热门和前沿领域,课程设计兼具前所未有的广度和深度,我真诚地推荐所有对大数据研究感兴趣的同学去学习这门课程。
-什么是大数据(What is big data?)
-为什么大数据是当前热点(Why big data is a nature phenomenon?)
--为什么大数据是当前热点(Why big data is a nature phenomenon?)
-新的计算基础设施和工具(New Infrastructure and tools)
--新的计算基础设施和工具(New Infrastructure and tools)
-课程简介(Course Introduction)
-基础设施,机器学习和可视化(Infrastructure,Machine Learning and Visualization)
--基础设施,机器学习和可视化(Infrastructure,Machine Learning and Visualization)
-大数据与传统商业智能的区别(Big data:different from traditional BI)
--大数据与传统商业智能的区别(Big data:different from traditional BI)
-Quiz
--Quiz--作业
-大规模超文本网络搜索引擎的解析(the anatomy of a large scale hypertextual web search engine)
--大规模超文本网络搜索引擎的解析(the anatomy of a large scale hypertextual web search engine)
-搜索引擎如何实现每秒数千次的查询(How does a web search engine process thousands of queries per second?)
--搜索引擎如何实现每秒数千次的查询(How does a web search engine process thousands of queries per second?)
-探寻搜索的多个维度(finding dimensions for queries)
--探寻搜索的多个维度(finding dimensions for queries)
-Quiz
--Quiz--作业
-背景介绍(background)
-用户移动规律的理解-1(user mobility understanding-1)
--用户移动规律的理解-1(user mobility understanding-1)
-用户移动规律的理解-2(user mobility understanding-2)
--用户移动规律的理解-2(user mobility understanding-2)
-用户画像与个人隐私-1(user profiling and privacy-1)
--用户画像与个人隐私-1(user profiling and privacy-1)
-用户画像与个人隐私-2(user profiling and privacy-2)
--用户画像与个人隐私-2(user profiling and privacy-2)
-Quiz
--Quiz--作业
-城市计算中的大数据研究简介(introduction to urban big data)
--城市计算中的大数据研究简介(introduction to urban big data)
-概念,框架和挑战(concepts,framework and chanlleges)
--概念,框架和挑战(concepts,framework and chanlleges)
-基础技术(fundamental techniques)
--基础技术(fundamental techniques)
-城市规划(urban planning)
-识别特定区域(indentify functional regions)
--识别特定区域(indentify functional regions)
-城市空气质量与大数据研究(urban air quality meets big data)
--城市空气质量与大数据研究(urban air quality meets big data)
-能源交通和环境污染(traffic energy and pollution)
--能源交通和环境污染(traffic energy and pollution)
-大数据在城市噪音处理中的应用(diagnose urban noise with big data)
--大数据在城市噪音处理中的应用(diagnose urban noise with big data)
-Quiz
--Quiz--作业
-软件分析的概念(the concepts of software analytics)
--软件分析的概念(the concepts of software analytics)
-软件分析的实例(examples of software analytics)
--软件分析的实例(examples of software analytics)
-传统的数据可视化(Traditional information visualization)
--传统的数据可视化(traditional information visualization)
-同质数据的可视化分析-1(Visual Analytics of Homogeneous Data-1)
--同质数据的可视化分析-1(Visual Analytics of Homogeneous Data-1)
-同质数据的可视化分析-2(Visual Analytics of Homogeneous Data-2)
--同质数据的可视化分析-2(Visual Analytics of Homogeneous Data-2)
-异质数据的可视化分析(Visual Analytics of Heterogeneous Data)
--异质数据的可视化分析(Visual Analytics of Heterogeneous Data)
-Quiz
--Quiz--作业
洪小文博士现任微软公司资深副总裁,微软亚太研发集团主席兼微软亚洲研究院院长,全面负责微软在亚太地区的科研及产品开发工作,以及与中国及亚太地区学术界的合作。洪小文博士是电气电子工程师学会院士(IEEE Fellow),微软杰出首席科学家和国际公认的语音识别专家。洪博士现任《美国计算机协会通讯》(Communications of the ACM) 的编委,并在国际著名学术刊物及大会上发表过百余篇学术论文。他参与合著的《语音技术处理》(Spoken Language Processing)一书被全世界多所大学采用为语音技术教学课本。另外,洪博士在多个技术领域拥有36项专利发明。洪小文博士已在微软公司工作了20年。他于2004年加入微软亚洲研究院担任副院长,2007年升任微软亚洲研究院院长,2014年兼任微软亚太研发集团主席。与此同时,洪博士于2005年至2007年间创立并领导了搜索技术中心(STC),该中心负责微软搜索产品(必应)在中国的开发工作。在加入微软亚洲研究院之前,洪博士是微软公司自然交互服务部门的创始成员和架构师,除了全面负责屡获殊荣的微软语音服务器产品、自然用户界面平台以及微软协助平台的架构及技术工作,他还负责管理和交付统计学习技术和高级搜索。洪博士于1995年加入微软研究院美国总部任高级研究员,并为微软的SAPI和语音引擎技术做出了突出贡献。此前,洪博士曾任职于苹果公司,带领团队研发出了苹果中文译写器。洪小文博士毕业于台湾大学,获电机工程学士学位,之后在卡内基梅隆大学深造,先后获得计算机硕士及博士学位。
宋睿华博士现任微软亚洲研究院主管研究员,从事搜索和数据挖掘方面的研究。她的研究兴趣包括互联网搜索与评价、数据抽取和挖掘。近期特别对用户建模、社交网络挖掘和智能手机挖掘感兴趣。宋睿华博士在国内外顶级会议和杂志上发表论文30余篇,并曾任SIGIR、SIGKDD、CIKM、WWW、WSDM等国际会议和TKDE、TOIS、Information Retrieval等国际杂志的评审委员。她是EVIA2013和2014的主席。她还提出并组织了NTCIR Intent tasks。宋睿华于2000年和2003年在清华计算接科学与技术系获得学士和硕士学位。之后,加入微软亚洲研究院工作至今。工作的同时,她于2010年取得了上海交通大学计算机系博士学位。
谢幸博士于2001年7月加入微软亚洲研究院,现任高级研究员,并任中国科技大学兼职博士生导师。他分别于1996年和2001年在中国科技大学获得计算机软件专业学士和博士学位。目前,他的团队在空间数据挖掘、位置服务、社交网络和普适计算等领域展开创新性的研究。他在国际会议和学术期刊上发表了160余篇学术论文,并拥有50余项专利。他是ACM、IEEE高级会员和计算机学会杰出会员,多次担任WWW、UbiComp、ACM SIGSPATIAL、KDD等国际会议程序委员会委员。他是ACM Transactions on Intelligent Systems and Technology、Springer GeoInformatica、Elsevier Pervasive and Mobile Computing、Journal of Location Based Services和中国计算机学会通讯等杂志编委。他参与创立了ACM SIGSPATIAL中国分会,并曾担任UbiComp 2011,PCC 2012和UIC 2015等会议程序委员会共同主席。
微软亚洲研究院主管研究员,主要研究方向为城市大数据、时空数据挖掘和普适计算等。他提出了“城市计算”的理念,其中以主作者身份在VLDB、KDD、TKDE等国际会议和刊物上发表相关论文百余篇,并在ICDE2013和ACM SIGSPATIAL2011等会议上五次获得最佳论文奖,获得24项国际发明专利和三项技术转化奖。由他主编的《Computing with Spatial Trajectories》一书被多个国家的高校选用为教材,被Springer评为(全球华人撰写的)最受欢迎的计算机类图书之一。他主持开发了GeoLife,T-Drive和Urban Air等城市大数据系统,多次被科技评论等国际权威媒体报道,其中Urban Air被中国环保部用于监测和预报细粒度空气质量。他是ACM Transactions on Intelligent Systems and Technology的主编和IEEE Spectrum的顾问委员会成员,以及IEEE Transactions on Big Data和GeoInformatica的编委。他担任过数据库领域会议ICDE2014程序委员会主席、普适计算领域会议UbiComp 2011本地主席等十几个会议主席等职位。他受邀在APEC2014等十多个国际会议和论坛上做大会主题报告,并多次在MIT、CMU、康乃尔等顶尖学府讲学。他也是中国计算机学会的杰出讲者和杰出会员,以及上海交通大学讲座教授和香港理工大学客座教授。2013年,他因在城市计算领域的贡献被MIT科技评论评为全球杰出青年创新者(MIT TR35)。2013年11月,他作为现代创新者代表登上了美国《时代》周刊。2014年,由于他主导的城市计算具有巨大的商业前景和改变行业格局的潜力,他被美国《财富》评选为中国40位40岁以下商界精英。
张洪宇博士目前是微软亚洲研究院主管研究员。在2014年加入微软前,他是清华大学软件学院副教授, 博士生导师。他也曾任澳大利亚皇家墨尔本理工大学(RMIT University)计算机科学与信息技术学院讲师。他于2003年新加坡国立大学计算机科学系博士毕业。他的主要研究方向是软件工程, 特别是软件分析、质量保证、软件维护、软件度量及软件重用。他在国际著名会议和期刊上(如TSE, TOSEM, ICSE, FSE, ASE, ISSTA, ICSM, ICDM, CIKM, and USENIX ATC)发表了80多篇论文,并获得过2次ACM杰出论文奖。他也是多个国际会议的程序委员会成员。更多关于他的信息请见: http://research.microsoft.com/people/honzhang/.