AI(人工智能)通过满足工作负载需求正在深刻改变着世界。然而,尽管AI正以无数种方式影响着人们的工作效率、创造力乃至整个社会,但根本的变革却发生在为这项技术本身提供底座支撑的数据中心当中。
随着规模的持续扩大和复杂性的不断增加,AI正以前所未有的速度重新塑造和配置网络。面对不断变化的环境,确保AI数据中心具有广泛的性能、可扩展性和更高的效率已成为一项日益复杂的挑战。
拥抱变化,阔步前行,技术进步的曙光就在前方。在此篇专题文章中,是德科技副总裁兼网络应用与安全解决方案事业部总经理Ram Periakaruppan通过访谈的形式详细探讨了AI数据中心的发展方向。
是德科技走在AI数据中心网络前沿
在是德科技,Ram Periakaruppan带领的团队走在了AI研发的前沿,致力于开发先进的基准测试、验证和优化解决方案,帮助业界驾驭快速发展的AI基础设施。
在Ram Periakaruppan看来,自己非常有幸与全球具创新精神的云服务提供商和企业客户合作,帮助他们加快AI部署、优化网络性能并增强安全性。
是德科技正在助力整个行业塑造AI数据中心的未来发展。
AI工作负载是目前整个技术行业的热门话题。在此背景下,企业在升级基础设施以支持AI持续增长的过程中,面临着哪些大的挑战?
大规模的AI训练工作经常会遇到瓶颈,如功率限制、带宽效率低下和组件故障等。这些问题都会严重影响AI数据中心的性能和可扩展性。
更关键的是,任何GPU利用率低下的情况都会放大这些限制。持续的流量传输意味着GPU之间需要进行大量数据迁移,这可能导致网络堵塞,从而挑战现有数据中心基础设施的极限。
应对此类挑战尤为困难,业界是否已采取相应的措施,来改善这一状况?
数据中心的组件可能通过了所有的性能压力测试,但在系统层面仍会出现故障。这意味着,任何一个薄弱环节都可能会在整个系统层面对AI数据中心产生影响,导致任务完成时间延长。
业界已经认识到,这些高度互联的系统需要全栈式的验证和优化解决方案。这意味着必须将验证环节提前到产品设计和制造周期的早期阶段。
是德科技的承诺
为了帮助客户优化AI基础设施,是德科技推出了全新的KAI系列解决方案,包括KAI数据中心构建器。
是德科技人工智能(KAI)系列解决方案
KAI是一套系统级的解决方案,旨在帮助客户应对早期的验证挑战,覆盖从硅前验证,到器件/组件验证,再到整个系统验证的全流程。KAI 系列解决方案专注于四个领域:高速计算、互连、网络和能效,每个领域都有强大的解决方案组合。无论是构建网络设备还是管理AI数据中心,是德科技的解决方案都涵盖了从物理层到应用层的各个层级和全部技术栈,有助于大规模设计、验证、优化、仿真和基准测试AI基础设施。
利用KAI解决方案优化基础设施
是德科技的客户,一家头部云服务提供商,使用KAI数据中心构建器对其全新的AI训练集群的网络设计执行基准测试。这家头部云服务提供商需要确保其800 G以太网网络已为数据中心构建做好准备。这意味着他们的设计不仅要支持当前的GPU型号,还要支持尚未发布的新一代GPU型号。
使用KAI数据中心构建器,该云服务提供商能够模拟这两种GPU特有的AI工作负载。此外,通过分析每种类型的GPU对网络配置的影响,该云服务提供商还能够针对多代GPU优化网络,从而为未来的部署做好准备。
AI的普及和演进将如何影响下一代AI数据中心
随着AI工作负载不断发展,市场对经过优化,具备可扩展性和高性能的AI基础设施的需求空前高涨。与此同时,功率限制、带宽效率低下和网络级故障是AI数据中心必须克服的挑战。
是德科技很高兴能与AI加速器供应商、网络和计算硬件提供商以及超大规模AI运营商合作,共同推动AI基础设施的发展。展望未来,是德科技期待与产业各方力量携手应对AI领域的核心难题,打造下一代AI数据中心。
好文章,需要你的鼓励
随着沃尔玛电商部门年化GMV突破1000亿美元,AI驱动的商务正在加速发展。Onton获得由Footwork领投的种子轮融资,定位为电商决策的起点。该平台通过神经符号引擎解决传统电商搜索痛点,在家居装饰领域快速扩张,月活用户从5万增长至100万。沃尔玛和好市多等零售巨头已在运用AI重塑购物体验,消费者期望正在发生根本性转变。
斯科尔科技学院联合俄罗斯多家研究机构开发出革命性的多语言AI虚假信息检测技术。该研究构建了覆盖14种语言的大型数据集PsiloQA,通过"诱导AI说谎"的创新方法自动生成训练样本,成本仅为传统人工标注的数十分之一。实验证明多语言训练的检测模型性能显著优于单语言模型,为全球AI可信度监督提供了实用解决方案。
卫星连接领域领军企业星链与BICS达成战略合作,指定Proximus Global为其在欧洲直连手机卫星服务的首选IPX提供商。该合作将使星链利用现有IPX网络连接移动运营商,并为能够向智能手机提供宽带服务的下一代网络铺平道路。星链直连手机服务拥有超过650颗低轨卫星,可在移动信号盲区提供数据、语音、视频和消息服务,连接五大洲超800万用户。
NVIDIA研究团队发现,训练机器人最有效的方法竟然是最简单的:直接用普通文字告诉机器人该做什么,而不需要复杂的编码系统。他们开发的VLA-0系统在标准测试中超越了所有复杂方法,平均成功率达94.7%,在真实机器人测试中也比预训练系统高出12.5个百分点。这项发现挑战了"越复杂越好"的传统观念,可能加速智能家用机器人的普及。