扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
由中国科学院计算技术研究所主办,一年一度的Hadoop中国2011云计算大会(Hadoop in China 2011,HiC2011)将于12月2日至3日在北京会议中心召开,这将是Hadoop in China社区的一次年度技术盛会! 大会将联合国际和国内Hadoop及云计算技术应用的成功企业,并引入国际研究界对于云计算及DISC(Data Intensive Super Computing)研究方向的学术观点。通过技术应用和科学研究双重视角审视云计算技术及Hadoop开源生态系统的现状和发展趋势。大会特别邀请了Lucene、Nutch、Hadoop等开源软件之父,Apache软件基金会主席兼Apache Hadoop项目负责人Doug Cutting先生;Condor创始人University of Wisconsin–Madison的Miron Livny教授;、GOOGLE、facebook等众多专家现场演讲交流,部分专家是首次在中国进行交流。
近几年来,越来越多的国内外 互联网公司和传统企业都已意识到数据资产规模化带来的潜在价值。以Hadoop为代表的大规模数据处理(Big Data Processing)技术的日趋成熟使得“业务为王”向“数据为王”转变。如淘宝公司的“数据魔方”应用,基于全网交易数据的分析和挖掘,向用户提供行 业动态热点和市场发展趋势的深度数据服务。大规模数据处理技术的发展往往超出想象。拿已有6亿用户的Facebook的为例,大规模数据处理更向着实时化 迈进,其ETL(Extract, Transform, Load)延迟从原来的24到48小时演进到小于10秒,以满足在线和实时数据分析的需求。可以看出“如果性能不满足需求就是功能缺失”这样的系统设计指 导思想。此外,规模化的数据如果没有合适的“掘宝工具”是无法体现其价值的。信息检索、内容挖掘、自然语言理解、数据可视化、计算广告学、地理信息系统等 领域均采用Hadoop技术研究和开发从数据到价值的各类工具,起到了“海量数据掘宝”的作用。
Hadoop社区的繁荣有目共睹。越来越 多的国内外公司参与到Hadoop社区开发,或者直接将线上使用的软件开源。这极大地促进了Hadoop技术在国内的推广发展,扩大了大规模数据处理的应 用范围。我们欣喜地看到,学界对Hadoop的研究热情不减,今年的VLDB上就出现了数篇与MapReduce/Hadoop相关的论文。这说明 Hadoop还有很多可完善可改进的地方。另一方面,一些商业软件也在向Hadoop技术靠拢,兼容Hadoop软件栈。同时,国内外出现了一批以提供 Hadoop技术咨询和服务的公司,Hadoop大规模数据处理技术的商业价值逐渐得到业界的重视。
Hadoop in China大会已历经四届,今年的大会主题是“海量数据掘宝”。希望以“最细致的研发细节,最直接的交流互动”使此次大会达到“理解实际需求,聆听大师观点,促进应用实践,发扬开源精神”的目的。更希望通过HiC2011大会结识更多的Hadoop草根英雄!
HiC2011将 继承之前几届的办会宗旨,发扬开源精神,不遗余力地促进Hadoop及云计算开源生态系统在国内的发展壮大。
大会官方网站地址:
http://hic2011.hadooper.cn/dct/page/1?
大会日程:
注:会议日程以会议当天实际日程安排为准,大会组委会对会议日程有最终解释权
12月2日(星期五)
8:30 – 9:00
签到&注册
9:00 – 9:10
介绍到场嘉宾,主办方致欢迎辞
主题演讲(上午)
9:10 – 10:00
The Challenges and Opportunities in Interfacing Hadoop with Condor, Miron Livny, Professor, Computer Sciences Department, University of Wisconsin
10:00 – 10:50
Pregel for Large-Scale Graph Processing at Google, Grzegorz Malewicz, Staff Software Engineer, Google inc.
10:50 – 11:00
Break
11:00 – 12:00
待定
午餐(12:00~13:30)
分会场报告(下午)
Hadoop生态系统开发
Hadoop Ecosystem Development
主席:Chihong Liang(Yahoo!),马如悦(百度)
13:30~14:20
待定,Yahoo!
14:20~15:10
DISQL2.0: 一种海量数据处理语言,陈晓鸣,百度
15:10~15:20
Break
15:20~17:00
Panel Discussion: Why and How to improve the NameNode Implementation of HDFS
HDFS元数据的独立服务和独立持久化存储,罗李(淘宝花名:鬼厉),淘宝
Fault tolerant Name Node – eBay way, David Liao, eBay inc.
HDFS2: HDFS的一种分布式NameNode实现,孙桂林,百度
Big Data应用
Big Data Applications
主席:谭颖亮(淘宝),张刚(人民搜索)
13:30~14:20
Data Freeway and Puma: Realtime Data Streams and Analytics,邵铮(Zheng Shao),Facebook inc., Apache Hadoop and Hive
14:20~15:10
Using Hadoop/MapReduce with Solr/Lucene for large scale distributed search,陈昭宇 (James Chen) ,精诚资讯(SYSTEX)
15:10~15:20
Break
15:20~16:10
Hadoop技术在传统IT业的应用,华为
16:10~17:00
支付宝数据平台技术及应用,蒋杰(平原君),支付宝
NoSQL系统及应用
NoSQL System and its Applications
主席:钱岭(中国移动研究院),惠涛(华为)
13:30~14:20
中国移动大云NoSQL系统设计与应用,郭磊涛,中国移动研究院
14:20~15:10
Intro to HBase and its usage in eBay, Ming Ma, eBay inc.
15:10~15:20
Break
15:20~16:10
HBase性能优化及改进,张毅(淘宝花名:务挺),淘宝
16:10~17:00
待定,FreeWheel
云计算研究
Cloud Computing Research
主席:文继荣(微软亚洲研究院),詹剑锋(中科院计算所)
13:30~14:20
Optimizing the Performance and Scalability of MapReduce for Multicore-based Clusters,陈海波,复旦大学
14:20~15:10
虚拟化技术在Hadoop生态系统中的应用,杨晓伟,华为
15:10~15:20
Break
15:20~16:10
数据中心计算Benchmark和测试床,詹剑锋,中科院计算所
16:10~17:00
云存储和云安全,武永卫,清华大学
12月3日(星期六)
主题演讲(上午)
9:00 – 9:50
Hadoop at eBay overview, Juhan Lee, Director, Infrastructure Automation, eBay inc.
9:50 – 10:40
Keynote2 待定
10:40 – 10:50
Break
10:50 – 12:00
待定
午餐(12:00~13:30)
分会场报告(下午)
Hadoop生态系统开发
Hadoop Ecosystem Development
主席:Chihong Liang(Yahoo!),马如悦(百度)
13:30~14:20
HBase coprocessor and security consideration,讲者待定,TrendMicro, Apache HBase
14:20~15:10
待定
15:10~15:20
Break
15:20~16:10
待定
16:10~17:00
HDFS的透明压缩存储和压缩传输,刘景龙,百度
Big Data应用
Big Data Applications
主席:谭颖亮(淘宝),张刚(人民搜索)
13:30~14:20
待定,腾讯
14:20~15:10
待定,人民搜索
15:10~15:20
Break
15:20~16:10
基于Hadoop的SNS统计平台和聚类推荐,白伯纯 / 张叶银,人人网
16:10~17:00
分布式流数据实时与持续计算平台,强琦,阿里巴巴
NoSQL系统及应用
NoSQL System and its Applications
主席:钱岭(中国移动研究院),惠涛(华为)
13:30~14:20
Building mission critical messaging system on top of HBase. Guoqiang Jerry Chen/Liyin Tang, Facebook inc., Apache HBase
14:20~15:10
待定
15:10~15:20
Break
15:20~16:10
OceanBase – 淘宝千亿级海量数据库,杨传辉(淘宝花名:日照),淘宝
16:10~17:00
支持海量日志处理的NoSQL数据库,王树鹏,中科院计算所
云计算研究
Cloud Computing Research
主席:文继荣(微软亚洲研究院),詹剑锋(中科院计算所)
13:30~14:20
Big Data Intelligence,张弓,华为
14:20~15:10
待定
15:10~15:20
Break
15:20~16:10
城市计算,郑宇,微软亚洲研究院
16:10~17:00
待定