英特尔近日宣布FPGA业务独立,该业务将销售用于从蜂窝塔到机器人等系统的可重新配置芯片。
英特尔FPGA业务的根源可以追溯到一家名为Altera的芯片制造商,后者成立于1983年。英特尔在2015年以167亿美金收购了这家公司,后来将其并入英特尔的数据中心部门。去年,英特尔宣布计划把Altera从数据中心部门剥离出来,成为一个独立的业务部门。
处理器中的晶体管被组织成模块,每个模块执行一组不同的任务。一个模块可能会被优化以执行矩阵乘法,这是机器学习模型用来处理数据的数学计算,反过来,相邻的晶体管簇可能主要专注于加密网络流量。
大多数处理器不允许用户更改晶体管集群执行什么任务以及执行方式。英特尔新独立的Altera部门,销售FPGA芯片则支持定制。企业可以调整FGPA的设计,以提高运行目标工作负载的速度或者降低功耗。
例如,一个开发AI驱动的智能家电的硬件团队,可以对FPGA中大部分的电路进行优化,用于执行矩阵乘法。处理器拥有的AI优化电路越多,运行机器学习模型的速度也就越快。FGPA不仅能够定制板载计算模块,还能够定制管理这些模块之间数据流的互连方式。
Altera是由首席执行官Sandra Rivera领导的,她曾经是英特尔数据中心部门的负责人。在今天的网络会议中Rivera表示,Altera的潜在市场规模将在几年内达到550亿美金,此外她还提供了关于Altera产品开发路线图的最新信息。
Rivera预览了Agilex 3,这是即将推出的FPGA系列,适用于需要有限计算能力的低功耗设备。Altera预计,这些芯片可用于云、通信和边缘计算环境,将在今年晚些时候分享有关该产品系列的更多细节。
在不久的将来,Altera将推出中端FGPA系列名为Agilex 5系列。英特尔表示,这个产品系列是基于10纳米工艺的,每瓦性能比使用7纳米技术制造的竞争对手产品高出60%。
另一个卖点是Agilex 5配备了数字信号处理器(DSP),使用AI优化的电路来加速计算。DSP是一种专用处理器,专为压缩多媒体文件和消除其中可能包含的任何传输错误等任务而开发。Agilex 5还包括了其他计算模式,例如基于Arm设计的CPU核心。
英特尔这次还提供了关于Altera此前公布的Agilex 7和Agilex 9产品线的更新信息,并表示,前一个芯片系列已经“投入生产”,而后者现已经投入量产。
Agilex 7针对数据中心、网络和国防系统的使用进行了优化,Agilex 9则面向雷达和军事航空航天用例,两条产品线都针对混合信号处理或编码为1和0的标准数据以及雷达读数等其他类型信号的任务处理进行了优化。
Rivera表示:“客户要应对日益复杂的技术挑战,努力从竞争对手中脱颖而出并加快实现价值的速度,在这个背景下,我们有机会重振FPGA市场。”
Altera的主要竞争对手是AMD,后者在2022年以500亿美金收购了Xilinx,进入FPGA市场,这笔交易也是半导体行业有史以来规模最大的收购。根据IDC的估计,由于这次收购使得AMD在FPGA市场占到了55%的份额,Altera的份额为30%多。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。