作者:MARIA DEUTSCHER
更新时间:美国东部时间2024年2月9日17:43
据信,英伟达公司正在组建一个新的业务部门,为云提供商和其他客户开发定制芯片设计。
路透社今天援引了九位知情人士的说法,报道了这一消息。这一举措将帮助英伟达在一个年价值约300亿美元的市场中建立更大的影响力。其他几家主要的芯片制造商(包括Marvel和AMD)已经在为客户提供定制或半定制处理器设计。
英伟达是数据中心图形处理单元的领先供应商。在基础设施即服务市场,亚马逊网络服务公司(Amazon Web Services Inc.)和谷歌(Google LLC)的云部门提供由英伟达GPU和内部开发的人工智能加速器支持的实例。据报道,这家显卡制造商正在组建的芯片设计部门是该“公司寻找其产品替代品以保护自己”工作的一部分。
支持企业的定制芯片设计工作,即使该企业最终没有购买其GPU,英伟达也可以获得收入。这种收入可以采取芯片设计费的形式,更值得注意的是,也可以采用授权收入的方式。
当半导体制造商帮助客户创建定制处理器时,通常不仅会带来技术专长,还会带来预封装的芯片组件蓝图。有了蓝图就不必从头开始构建一切,从而加快了开发速度。作为交换,客户向半导体制造商支付知识产权授权费用。
据报道,博通公司(Broadcom Inc.)向谷歌提供了互连蓝图,用于搜索巨头在云平台上提供的TPU系列AI加速器。去年5月,摩根大通(JPMorgan Chase & Co.)的分析师估计,这家芯片制造商在2023年有望通过合作伙伴获得30亿美元收入。据报道,除了提供与互连相关的知识产权外,博通还帮助谷歌优化了其TPU的设计,以便进行大规模生产。
英伟达可能正在寻求与云客户建立类似的合作伙伴关系。今天的报道没有具体说明该公司的芯片设计部门是将专注于人工智能加速器,还是也会开发其他类型的处理器。后一种选择可能会为英伟达带来额外的收入机会。
除了GPU,该公司还为数据中心制造中央处理器。2021 年,英伟达推出了一款名为Grace的服务器CPU,它基于Arm Holdings plc.的蓝图,配备了数十个内核。去年年底,路透社报道称,该公司还计划为个人电脑推出基于Arm的处理器。
英伟达进入芯片设计市场可能会给Marvel等现有玩家带来更多竞争。在过去的二十五年中,后者已为客户提供了2000多款定制处理器。除了设计服务外,它还提供预封装的芯片组件蓝图,使实现新处理器的存储、网络和网络安全功能变得更加容易。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。