10月24日,在以“从未知到可能”为主题的中科曙光2017智能峰会上,曙光公司专门为人工智能市场开发、设计的专用服务器SuperBOX引起了多方热切关注。该款SuperBOX产品搭载了寒武纪芯片,被命名为“Phaneron”。“Phaneron”一词是从Phanerozoic Eon衍生过来的,中文可译作“显生宙”,显生宙是地质学的一个年代,而寒武纪是显生宙的开始。
“这是中科曙光与寒武纪科技自去年开展战略合作以来的首个成果落地,一方面展示了双方在短时间内的合作迅速取得成效,另一方面则显示了双方联手有利于打通人工智能产业技术闭环,为进一步形成更健全的智能计算产业生态打下了坚实基础。”在智能峰会上对“Phaneron”进行发布时,曙光公司副总裁沙超群如是说。
2016年4月,在曙光“数据中国加速计划”发布会上,中科曙光与寒武纪正式签署战略合作协议,共同致力于面向深度学习等人工智能关键技术进行专用芯片及相关服务器产品的研发。仅仅一年半后,双方的合作就结出了硕果。
“Phaneron主要的业务场景是面向深度学习的在线推理业务环境,在线推理业务不同于离线训练,推理不需要密集的计算能力,而是需要及时响应。因此,完成推理服务,需要大量的部署前端加速芯片,以实时响应访问请求,对数据迅速做出判断。”沙超群介绍说:“Phaneron可以在4U空间中部署20个人工智能前端推理模块,能够为推理提供强大的计算支持;此外Phaneron还通过提高密度来降低总体服务器的部署数量,可显著降低项目总体投资。”
在深度学习领域,寒武纪人工智能专用芯片比传统的CPU/GPU在性能、功耗和芯片面积方面均有较大优势,是人工智能计算芯片中高性能和低功耗的杰出代表。“寒武纪与中科曙光系出同源,也是中科院计算所多年苦练技术内功的结晶。”曙光公司总裁历军评价说,寒武纪寄托着中国人工智能产业换道超车的希望,在正在爆发的人工智能技术产业,寒武纪无疑将在智能时代扮演重要角色。
“事实上中科曙光早在2013年就在人工智能领域有所布局,但与寒武纪的合作无疑更是对光明未来前景的提前部署。”历军透露,接下来,曙光公司还将根据广大用户对人工智能应用场景的具体需求,进一步与寒武纪开发更多搭载有寒武纪专用AI芯片的信息基础设施(如高性能计算机、云服务器等),并通过曙光在全国范围内的城市云等系统将高水平的人工智能计算赋能给用户。
作为中科院先进计算技术创新及产业化联盟理事长单位,历军表示,曙光一直都准备着做好前沿技术的转化器和价值倍增器:“‘兄弟连心其利断金’,未来曙光与寒武纪的进一步深化合作将不仅为双方布局人工智能产业奠定坚实基础、支持双方在各自的领域内做大做强,还将进一步完善中国人工智能产业的生态建设,打造我国更健全的智能计算产业。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。