【2022年11月23日,德国慕尼黑讯】高性能计算(HPC)数据中心对人工智能(AI)服务的持续需求正在推动该领域市场的增长。专用的AI加速器有助于大幅提升这些数据中心的性能和效率。如同许多关键的基础设施系统一样,可靠性和高可用性对于这些数据中心必不可少,但却极难实现。AI超级计算平台的开发者面对这些要求,只能诉诸于可监控电源并在组件热插拔时也能保护系统的热插拔解决方案。
英飞凌科技股份公司(FSE代码:IFX / OTCQX代码:IFNNY)推出XDP™ XDP710数字控制器来应对这些挑战,这是英飞凌智能热插拔控制器和保护电路(IC)系列的首款产品。这款热插拔系统监控控制器IC的输入电压范围为5.5 V至80 V,瞬态电压最高可达100 V并可持续500 ms。它由三个功能模块组成:第一个是专为满足英飞凌功率MOSFET特性而优化的高精度遥测和数字安全工作区(SOA)控制模块;第二个是系统资源和管理模块;第三个是应用于OptiMOS™ 、StrongIRFET™ 系列等n沟道功率MOSFET的集成栅极驱动器和电荷泵模块。

NVIDIA高级电源架构师兼领域专家Abhijit Datta表示:“英飞凌科技的XDP710数字热插拔控制器很好地满足了HGX平台的产品需求。XDP710提供独有的功能,比如可选择通过并排电阻来选型外部MOSFET以及启动上升模式。XDP710小型封装和易于设计对我们很有帮助。”
英飞凌科技电源与传感系统事业部电源管理IC业务副总裁Shahram Mehraban表示:“XDP710热插拔控制器是一款功能丰富的产品,拥有高精度模拟前端以及综合的健康监测、遥测、可编程性和预设MOSFET SOA。它解决了当前可插拔式AI服务器解决方案面临的相关设计挑战。”
XDP710控制器的主要特点是其先进的闭环SOA控制和全数字操作模式。这不仅减少了物料BOM成本,还减少了外围元器件数量和设计时间,进而加速产品上市。XDP710也支持传统系统的模拟辅助数字模式。
供货情况
采用29引脚(6 x 6 mm²)VQFN封装的XDP710数字热插拔系统监控控制器IC现已投产。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。