至顶网服务器频道 05月09日 新闻消息(文/刘新萍): 浪潮将在2017 GPU技术大会(GTC2017)发布一款全新的高密度人工智能超算,希望以此加速人工智能和科学工程计算等领域的研究应用效率。


GPU17大会现场
浪潮将在5月10日在其展台发布这款新型的AI超算AGX-2,它将2U空间内支持部署8块NVLink或PCI-E 接口的NVIDIA P100 GPU,并支持NVLink 2.0和下一代Volta GPU。它是浪潮在人工智能计算服务器上的成功创新,将为全球客户提供更高效的计算力资源。
浪潮目前已具备覆盖单机2/4/8卡在内的业界最全GPU服务器产品线,而在GTC17之前的IPF17上,浪潮与百度联合发布了面向更大规模数据集和深层神经网络的超大规模人工智能计算平台AI-SR整机柜服务器,实现单机16块GPU加速卡扩展,满足对千亿样本、万亿参数级别的模型训练要求。
作为中国领先的云计算厂商,浪潮一直致力于为人工智能提供领先计算力。目前,浪潮已是全球Super7互联网公司中的三家(Baidu、Ali和Tencent)的AI GPU服务器的主要供应商,并与科大讯飞、奇虎360、搜狗、今日头条、Face++等人工智能领先公司保持在系统与应用方面的深入紧密合作,帮助客户在语音、图像、视频、搜索、网络等方面取得数量级的应用性能提升。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。