整机柜服务器之往事
毫无疑问,互联网的发展正在迅速改变着我们所处的世界,从生活到工作,均带来了深远的变革。而支撑这一切变化的,最终可追溯至基础的IT架构与形态的改变 。云计算、大数据早已不绝于耳,这种更大范围内的数据、应用的集中,也造就了越来越庞大的数据中心,其规模在10年前都不可想象。与此同时,在这一进程中占据不同制高点的互联网巨头们也拥有了越来越强势的话语权,它们一方面在改变着我们的生活、工作的形态与习惯,一方面也在引领着IT基础设施的变迁,甚至改变了传统的IT产品设计、采购与商业服务模式。这其中,开放式硬件设计就是一个典型的趋势。
无论是全球还是中国,巨型的互联网企业,由于其IT设备采购规模巨大,且自身应用高度自主开发的特点,越来越不满足于传统的标准化 硬件架构——由硬件厂商提供的标准化设计的Box与相应的基础设施解决方案。虽然各大IT厂商均成立了互联网应用的产品事业部以应对互联网市场的迅猛发展,并开发出了一系列更高密度的产品(比如2in1、3in1、4in1等多节点服务器),但是仍然不能满足所有的要求,尤其是巨型互联网企业的需求——他们需要更特殊的设计与服务。而这些巨头们的自身业务成长与庞大的采购需求,足以改变传统的商业模式——它们可以根据自己的应用需求来寻找可定制化的硬件厂商进行合作,以前者提供的规格来生产自己专属的硬件基础设施,这样做的好处多多,一方面能最大限度为自己的应用优化,提高数据中心运行效率,一方面也能进一步降低成本,提高单位面积的数据中心利用率与投资回报率(ROI)。
面向互联网与云计算设计的多节点机架服务器,对于大规模的互联网数据中心来说,仍然是“杯水车薪”
由此,开放式硬件设计应运而生——它们主张更为彻底的重构硬件,将原本放在标准化Box里的元件全拿出来,再在更大尺寸的物理框架进行重新整合,而这个新的物理框架就是原来的机柜——原本用来装载标准化Box的大型“机箱”,这样设备也将以机柜为单位进行横向扩展(Scale-Out),这显然是符合大型互联网应用与数据中心建议需求的,也因此受到了互联网巨头们的认可与关注。逐渐的,为了让相应的设计在更大范围内标准化,以保证采购效率与成本,开放式硬件联盟出现了。在国外,以Facebook主导的OCP(Open Compute Project开放式计算项目)就是著名一例,而在国内与之对应的就是天蝎计划(Project Scorpio)。
天蝎计划是最早由百度、阿里、腾讯三家中国最大的互联网公司(俗称BAT)发起,后中国电信、中国移动相继加入,并由英特尔作为技术顾问成立的整机柜服务器解决方案项目,先后有多家国内外服务器厂商参与研发。项目组于2011年11月1日在深圳发起成立 (正好是天蝎座的日期段内,不知这个名字是不是与此相关:P)。2011年12月22日, 在杭州集聚了DELL、HP、IBM、华为、联想、浪潮、 曙光等国内外主流服务器厂商,进行了一次全面的深入的技术研讨会。2012年4月11日, 在北京IDF2012上对外发布了《天蝎项目整机柜服务器技术规格》Version 1.0版本,2014年9月,天蝎整机柜2.0版规范正式发布,同时天蝎联盟也正式更名为“开放数据中心委员会”。
作为天蝎计划自始至终的产品方案的实施方, 浪潮的SmartRack就是一直沿着天蝎的轨迹发展至今,最终成为了中国市场上占有率最高的整机柜服务器。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。