互连创新对于更快地传输数据、释放更大的数据价值以及赋予客户精彩计算体验至关重要
本文作者:Sailesh Kottapalli,英特尔公司高级院士兼数据中心制程架构首席架构师
去年,英特尔领导层宣布了支撑所有产品的六大技术支柱:制程和封装、架构、内存和存储、互连、安全、软件。上周,英特尔推出了一个令人惊叹的以数据为中心的创新产品组合,包括全新处理器、内存、网络控制器、SSD、FPGA等。这两大举措都围绕这个新时代人们对数据的愿景——更快传输数据、存储更多数据、处理一切数据。
本周,我与英特尔的技术领导团队一起,分享了关于“更快传输数据”的最新消息,并详细介绍了互连技术在英特尔整个布局中所扮演的重要角色。
在互连技术领域,英特尔是业内投资部署最广泛的公司之一。英特尔的互连技术可实现片上、封装内、以及处理器节点间的通信。通过有线网,或者无线网络,数据将在数据中心、边缘设备、以及芯片之间传输。英特尔在所有这些跨越微米到英里传输距离的互连领域都处于领先地位。
数据正在以指数级的速度增长,互连技术提供了连接和传输数据的能力。据估计,世界上只有2%的数据经过分析,这意味着未来业务发展和数据洞察还有巨大的潜在开发机会。互连技术是原始数据以及通过计算引擎提取数据价值之间的链路。
快速增长的数据推动了对规模计算、存储和互连永无止境的需求。简而言之,我们可以创造最快的处理器、最智能的FPGA或容量最高的固态盘,但如果没有高性能互连技术来支持数据快速、高效地传输,整个系统或服务的性能将永远无法充分发挥其潜力。
数据如何在整个微米到英里传输距离的互连范围内移动,将为每个互连元件,以及横跨每个互连端的计算、内存和I/O组件的未来架构方向提供参考,并从整体来考虑如何维持从芯片到边缘设备的高效率数据流。
英特尔在多个互连领域的布局以及在诸如USB和近期发布的Compute Express Link (CXL) 开放互连技术等行业标准方面的领导地位,可以促使整个生态圈加速创新,推动技术演进,并且将释放整个市场的创造力以带来更高性能的系统和更好的数字服务。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。