AI(人工智能)通过满足工作负载需求正在深刻改变着世界。然而,尽管AI正以无数种方式影响着人们的工作效率、创造力乃至整个社会,但根本的变革却发生在为这项技术本身提供底座支撑的数据中心当中。
随着规模的持续扩大和复杂性的不断增加,AI正以前所未有的速度重新塑造和配置网络。面对不断变化的环境,确保AI数据中心具有广泛的性能、可扩展性和更高的效率已成为一项日益复杂的挑战。
拥抱变化,阔步前行,技术进步的曙光就在前方。在此篇专题文章中,是德科技副总裁兼网络应用与安全解决方案事业部总经理Ram Periakaruppan通过访谈的形式详细探讨了AI数据中心的发展方向。
是德科技走在AI数据中心网络前沿
在是德科技,Ram Periakaruppan带领的团队走在了AI研发的前沿,致力于开发先进的基准测试、验证和优化解决方案,帮助业界驾驭快速发展的AI基础设施。
在Ram Periakaruppan看来,自己非常有幸与全球具创新精神的云服务提供商和企业客户合作,帮助他们加快AI部署、优化网络性能并增强安全性。
是德科技正在助力整个行业塑造AI数据中心的未来发展。
AI工作负载是目前整个技术行业的热门话题。在此背景下,企业在升级基础设施以支持AI持续增长的过程中,面临着哪些大的挑战?
大规模的AI训练工作经常会遇到瓶颈,如功率限制、带宽效率低下和组件故障等。这些问题都会严重影响AI数据中心的性能和可扩展性。
更关键的是,任何GPU利用率低下的情况都会放大这些限制。持续的流量传输意味着GPU之间需要进行大量数据迁移,这可能导致网络堵塞,从而挑战现有数据中心基础设施的极限。
应对此类挑战尤为困难,业界是否已采取相应的措施,来改善这一状况?
数据中心的组件可能通过了所有的性能压力测试,但在系统层面仍会出现故障。这意味着,任何一个薄弱环节都可能会在整个系统层面对AI数据中心产生影响,导致任务完成时间延长。
业界已经认识到,这些高度互联的系统需要全栈式的验证和优化解决方案。这意味着必须将验证环节提前到产品设计和制造周期的早期阶段。
是德科技的承诺
为了帮助客户优化AI基础设施,是德科技推出了全新的KAI系列解决方案,包括KAI数据中心构建器。
是德科技人工智能(KAI)系列解决方案
KAI是一套系统级的解决方案,旨在帮助客户应对早期的验证挑战,覆盖从硅前验证,到器件/组件验证,再到整个系统验证的全流程。KAI 系列解决方案专注于四个领域:高速计算、互连、网络和能效,每个领域都有强大的解决方案组合。无论是构建网络设备还是管理AI数据中心,是德科技的解决方案都涵盖了从物理层到应用层的各个层级和全部技术栈,有助于大规模设计、验证、优化、仿真和基准测试AI基础设施。
利用KAI解决方案优化基础设施
是德科技的客户,一家头部云服务提供商,使用KAI数据中心构建器对其全新的AI训练集群的网络设计执行基准测试。这家头部云服务提供商需要确保其800 G以太网网络已为数据中心构建做好准备。这意味着他们的设计不仅要支持当前的GPU型号,还要支持尚未发布的新一代GPU型号。
使用KAI数据中心构建器,该云服务提供商能够模拟这两种GPU特有的AI工作负载。此外,通过分析每种类型的GPU对网络配置的影响,该云服务提供商还能够针对多代GPU优化网络,从而为未来的部署做好准备。
AI的普及和演进将如何影响下一代AI数据中心
随着AI工作负载不断发展,市场对经过优化,具备可扩展性和高性能的AI基础设施的需求空前高涨。与此同时,功率限制、带宽效率低下和网络级故障是AI数据中心必须克服的挑战。
是德科技很高兴能与AI加速器供应商、网络和计算硬件提供商以及超大规模AI运营商合作,共同推动AI基础设施的发展。展望未来,是德科技期待与产业各方力量携手应对AI领域的核心难题,打造下一代AI数据中心。
好文章,需要你的鼓励
谷歌在AI购物战中加码,宣布将Gemini打造成购物平台,并与Shopify、沃尔玛、塔吉特等主要零售商合作推出开源标准。公司发布了通用商务协议(UCP),旨在简化AI代理与零售商系统间的通信。新标准将为搜索和Gemini提供结账功能,用户可直接通过AI工具购买商品。已获得Visa、万事达、PayPal等20多家公司支持。此举使谷歌与微软Copilot和OpenAI的ChatGPT竞争。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
Helios Towers供应链总监Dawn McCarroll在采访中分享了公司的数字化转型经验。作为一家在非洲和中东地区运营近15000个移动通信塔站的公司,Helios正通过SAP S/4Hana系统升级、AI技术应用和精益六西格玛方法论来优化供应链管理。McCarroll特别强调了公司Impact 2030战略中的数字包容性目标,计划在未来五年内培训60%的合作伙伴员工掌握精益六西格玛原则,并利用大数据和AI技术实现端到端的供应链集成。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。