5月25~29日,为期5天的以“大数据开启智能时代”为主题的2016中国大数据产业峰会暨中国电子商务创新发展峰会(以下简称数博会)在贵阳盛大举行。中国工程院院士、浪潮集团执行总裁王恩东应邀参会,并在“中国信息系统集成发展论坛”作《融合架构引领云数据中心》的主题演讲。王恩东在会上表示,全球正迎来以云计算、大数据、深度学习等为依托的智慧计算时代,智慧计算将全面驱动数据价值的实现。
伴随可穿戴设备、智能终端、传感器等的广泛应用,全球正朝着信息化、智能化的趋势发展,由此带来了爆炸性的数据量,举例来看,连锁超市每天通过RFID产生10亿条消费记录,北京市的监控摄像头已经超过四十万个,每年产生500PB视频数据,iwatch每月新增計步、睡眠、心跳等人体数据7.4PB,此外,当前比较火热的VR,可以在观看足球比赛时沉浸入画面里面,让人具有身临其境的感觉,这就会产生大量的数据,数据显示,2020年全球数据量将达到35ZB,这就为数据的存储和计算带来了巨大的需求。
智慧计算为“数在转,云在算”提供计算支撑
李克强总理出席数博会时强调,大数据是钻石矿,而80%信息资源掌握在政府部门手中,政府要打破“信息孤岛”和“数据烟囱”推动数据共享,除隐私外,其它信息都应该向公众和社会开放,形成“人在干,数在转,云在算”的局面。
中国工程院院士、浪潮集团执行总裁王恩东
王恩东认为,从技术的角度看这一切需要智慧计算提供支撑。所谓智慧计算,应当是云计算作为计算、存储等资源的基础平台,大数据及大数据技术作为知识共享、价值挖掘的认知方法,而围绕深度学习的芯片、算法则成为智慧计算的基本工具。未来10年,智慧计算将成为IT投入的热点和重点,其规模占比预计在2025年有望超过2/3,引领计算的发展方向。
在王恩东看来,通过传感器和信息的传递,更多的新型智慧计算形式将更快的渗透到人们的日常生活,例如物联网、无人汽车,神经网络芯片,虚拟现实等,智慧计算将成为整个社会智能化发展的驱动力。
智慧计算时代,数据中心将走向融合架构
可以预见到,智慧计算时代,前端计算将朝着便携化、轻量化和泛在化发展,通过物联网将各种数据持续不断的向后端传输,同时,数据来源多样性、格式的复杂性和语义的不确定性使得后端计算量越来越大,后端数据中心会进一步走向集中化、规模化,越来越多的大规模数据中心会出现。数据显示,预计到2020年,将出现50万台容量的单一数据中心,5000台以上的数据中心服务器的数量将达到整个服务器保有量的近70%。
超大型数据中心的出现,对数据中心性能、效率、能耗等提出严峻挑战,传统数据中心必须进行各层面技术的创新与数据中心架构的变革,浪潮将这种适应未来需求的全新的数据中心架构定义为融合架构。
王恩东认为,智慧计算时代的数据中心将向融合架构演进,在硬件层将计算、存储、网络等各种设备中的同类资源整合为资源池,不同设备之间的同类资源能够任意重组,在软件层动态感知业务的资源需求,利用硬件重组的能力,智能的动态分配和组合资源,满足各类应用的需求。
据悉,2016年浪潮将持续深化计算+战略,全力发展融合架构2.0和生态2.0,加快硬件重构与软件定义的深度融合,促进云计算生态的建设,构建未来竞争力。
在前不久举行的浪潮服务器存储合作伙伴大会上(IPF2016),浪潮推出两款融合架构2.0新品——InCloudRack云一体机和大数据一体机。其中,InCloudRack云一体机面向企业私有云设计,以一体化网络引擎UNE构建了分布式网络,并通过软件定义的方式实现了柜内计算、存储和网络资源的集中池化、统一调度和统一管理。而大数据一体机则面向海量数据处理,是经过深度优化、开箱即用的融合大数据基础设施,提供GB到PB级海量数据的采集、存储、处理、挖掘洞察能力。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。