几个月以来,芯片圈波澜频起。AMD和英伟达的相关举动对高性能计算产业产生了不小影响。这场芯片产业的风云突变,将“国产GPU”推向了“漩涡”中心。
近年来,我国数字经济发展取得显著成效,为社会经济健康发展提供了强大动力。与此同时,我国数字经济也面临着关键领域创新能力不足、传统产业数字化发展相对较慢等问题。二十大报告强调,加快实施创新驱动发展战略,加快实现高水平科技自立自强。
GPU是当前数字经济驱动的最重要算力引擎之一,具有极高的战略地位,受到业内高度重视。而元宇宙、人工智能、云游戏、自动驾驶等新场景和需求爆发式增长,也都离不开GPU的高性能图像处理和渲染能力。在市场和政策的双向驱动下,国产GPU正迎来蓬勃发展的机会。
“苏堤”满声势 算力迎“春晓”
11月3日,摩尔线程在北京发布多款软硬件新品,包括新一代GPU“春晓”、面向个人电脑的消费级显卡MTT S80和服务器计算卡MTT S3000、一体化计算设备“MCCX元计算一体机”,以及开发套件、数字人解决方案等。
“春晓”GPU是继摩尔线程自今年3月发布第一颗多功能GPU芯片——“苏堤”以来,又一大核心产品。据悉,“春晓”GPU了集成220亿颗晶体管,内置MUSA架构通用计算核心以及张量计算核心,可以支持FP32、FP16和INT8等计算精度。相较于之前发布的“苏堤”芯片,“春晓”内置的四大计算引擎全面升级,带来了显著的性能提升:图形渲染能力方面平均提升3倍;编码能力提升4倍,解码能力提升2倍;AI计算加速平均提升4倍,物理仿真计算性能提升2.5倍。同时,还引入了新技术支持窄带高清,节约带宽30%以上。
值得注意的是,摩尔线程MTT S80是首款面向游戏玩家打造的国潮显卡,基于“春晓”GPU芯片打造,其拥有的4096个可编程MUSA核心,在1.8GHz的主频下,能够提供14.4TFLOPS的单精度浮点算力。同时,MTT S80还是业内首款配备PCIe Gen5接口的显卡产品,配合16GB GDDR6大容量高速显存,以及8K超高清与1080P 360Hz高刷新率显示输出能力。
现场,摩尔线程创始人兼CEO张建中宣布,MTT S80显卡已经完成首批生产与备货,将于2022年11月11日在京东电商平台开启限量销售。
MTT S80 显卡
自主创新路 行道艰且长
“春晓”的发布,无疑对我国GPU市场而言,又多了一支“升力军”。然而,GPU生态却是我国GPU厂商需要正视的问题。
当前,全球GPU产业生态历经不断更迭,变得庞大且复杂。而国产GPU要完成从研发到市场的商业化应用,离不开生态的有力支持。
对于GPU的生态建设问题,张建中坦言,“建设生态是比产品研发更难的事情。光是一个图形驱动就有一个操作系统的代码量。”这之中,究竟有多难?一位芯片从业者曾比喻,芯片开发的底层固件如果需要6个人,那么在这上面搭建操作系统和生态开发的,就需要36个人。如果产品研发需要一年时间,那么生态的建设可能就是三年甚至以上。
张建中强调,不同应用对GPU需求也不同,在评价一款GPU产品和其性能时,我们不能脱离应用环境。同时,如何做好驱动更新、环境和应用适配、本土化服务等工作也相当重要。中国GPU产业的发展还处在早期,应当理性看待,不能指望其一步登天。目前,应当是守望互助大过于竞争,加强协作共同打造产业生态。处于初创阶段的国内GPU企业需要快速推出市场化的GPU产品,但面临的难题在于背景是芯片设计、底层驱动开发等关键领域人才匮乏、团队缺少磨砺。
生态“促”算力 AI绘丹青
会议现场,摩尔线程还演示了40多个基于其多功能GPU的丰富应用,覆盖PC游戏、AI、数字人、数字孪生、物理仿真、8K多媒体显示、云游戏、云桌面、数字办公等场景。其中,摩尔线程与云南艺术学院设计学院共同成立的“AI艺术创作实验室”,并秀出了基于AIGC内容生成器“马良”联合创作的艺术作品,引得众人的围观。
AI绘制:阿努比斯之门
最近,AI创作一度成为AI领域最热门的话题,AI算法在消化大量图像、视频、文本后,能学会创作诗歌、文章、绘画、照片、视频等原创内容,其作品甚至能做到“以假乱真”,乃至被高价拍卖。
而这背后关键的力量之一就是——GPU算力的快速迭代升级。GPU算力资源已经成为AI计算不可或缺的基础设施,可以说在这一轮AI发展浪潮中,AI和GPU是相互成就。GPU算力的不断提升,带动AI计算突破了算力瓶颈,使AI得以大规模的应用;AI大规模应用以及越来越大规模的模型,也反之带动了GPU算力的不断提升。
据了解,摩尔线程此次发布的基于MUSA架构打造的MTT S3000,可为AI推理和训练、云游戏、云渲染、视频云、数字孪生、数字内容创作等场景提供通用智能算力支持,旨在为数据中心、智算中心和元计算中心的建设构建坚实算力基础,助力元宇宙多元应用创新和落地。
MTT S3000
当然,GPU算力的提升、发挥离不开技术的演进,更离不开用户生态的建设。正如张建中所言,“我们只有将生态伙伴、行业用户凝聚在一起,才能将摩尔线程的算力真正发挥出来,为元宇宙和数字经济提供核心动力。”
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。