英特尔的研究人员近日宣布在集成硅光子学领域取得了一些值得注意的进展,为实现处理器之间更高速的互连铺平了道路。
英特尔实验室(Intel Labs)表示,这一研究代表了扩展数据中心计算处理器之间的通信带宽以及跨不同网络通信带宽的“下一个前沿”。
硅光子学是一种将硅集成电路与半导体激光器相结合的技术,主要好处是能够比传统电子设备在更长的距离上更快速地传输数据。英特尔在其官网上解释说,硅光子学提供了更高的带宽、对计算和存储资源的软件可配置访问,同时还让软件定义的基础设施可以为分散的数据中心解耦硬件和软件资源。
英特尔是集成光子学领域的领导者,现有的100G收发器是5年前推出的,如今英特尔已经开始推进400G收发器的商用化,800G也列入了路线图中。然而,为了更进一步,英特尔需要找到一种方法把光子学与硅更紧密地进行集成。目前,英特尔已经在“共同封装光学”领域取得了进展,但最终目标是实现完全集成,也就是光子集成电路直接连接到计算的其他部分。
现在,英特尔提出了一种新技术来实现这一目标。英特尔实验室表示,预计该技术将让未来的I/O光子接口具有更高的能效和带宽、更远的覆盖范围。
这一发现集中在获得良好匹配的输出功率、均匀和密集间隔波长的可能性上。英特尔实验室高级首席工程师Haisheng Rong表示,利用英特尔晶圆厂现有的制造和工艺技术可以实现这些技术改进,从而确保对“下一代联合封装光学和光学计算互连的大规模量产”。
英特尔实验室表示,这项研究展现了他们在多波长集成光学领域取得的关键进展,例如,英特尔实验室展示了一个八波长分布式反馈激光阵列(如图),该阵列完全集成在硅晶片上,提供的输出功率均匀性和波长间隔均匀性远远超出现有标准所能达到的水平。
这一切意味着英特尔很快将能够开发一种光源,实现完全集成的光子学,为未来要求更高的大批量应用提供所需的性能。要满足这些需求,就要能够应对网络密集型工作负载(例如人工智能和机器学习)的光学计算互连需求。英特尔表示,这一激光阵列是在英特尔现有300毫米硅光子制造工艺基础上开发的,为大规模生产和行业广泛部署奠定了基础。
值得注意的是,与英特尔在3英寸或4英寸III-V晶圆厂中生产的传统半导体激光器相比,这项新技术实现了更好的波长均匀性。此外,由于紧密集成了激光器,当环境温度发生变化时,阵列仍能保持通道间距。
英特尔表示,该技术将用于未来光学计算互连小芯片产品中,这种产品将提供“包括CPU、GPU和内存在内的计算资源之间的高能效、高性能、每秒多兆比特的互连”。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。