从云到边缘基础架构,全面提升Ampere Altra系列的AI性能
中国,北京(2021年8月5日)——安晟培半导体科技有限公司(Ampere Computing)日前宣布收购AI技术初创公司OnSpecta,该收购将助力Ampere通过AI推理应用程序进一步增强Ampere Altra的性能。相较于常用的基于CPU的机器学习(ML)框架,OnSpecta深度学习方案(DLS)的AI优化引擎可带来显著的性能提升。目前,两家公司已开展合作,在基于Ampere的实例上运行了流行的AI推理工作负载,并展示了超过四倍的加速。此次收购将包括一个优化的模型集合(model zoo),包含对象检测、视频处理和推荐引擎等功能。
Ampere创始人、董事长兼首席执行官Renee James表示:“很高兴OnSpecta团队加入Ampere。借助他们在深度学习领域的专业积累,Ampere将推出更强大的推理任务处理平台,提供更低的能耗、更强的性能、更高的可预测性。此次收购也凸显了我们致力于为云和边缘部署的客户提供差异化的云原生计算平台的承诺。”
据IDC研究显示,到2024年,AI服务器市场市值预计将超260亿美元,年增长率将达13.7%。在中心和边缘的基础架构中,Ampere的客户正在寻找解决方案,以管理AI推理任务成本和不断增长的需求。DLS为无缝二进制drop-in库,适用于多种AI框架,可大幅提升Ampere Altra上的推理速度。它支持使用Altra-native FP16数据格式,该格式可将FP32格式的性能提高一倍,且不会显著降低精度,也无需重新对模型进行训练。
OnSpecta联合创始人兼首席执行官Indra Mohan表示:“本次收购是我们双方通力合作后水到渠成的结果。加入Ampere后,我们将进一步助力Ampere Altra取得更大的成功,为客户提供关键支持,让Altra产品系列更好地用于各种AI推理用例。”
Oracle云基础设施执行副总裁Clay Magouyrk表示:“在Oracle OCI Ampere A1实例上,Ampere Altra和OnSpecta所展现的强大性能和易用性有目共睹。凭借DLS在所有主要开源AI框架(包括Tensorflow、PyTorch和ONNX)上的兼容性,以及Ampere Altra可预测的性能,OCI Ampere A1将在AI推理工作负载中继续开拓创新。”
依据惯例,此次收购将于8月完成,具体交易条款未披露。
好文章,需要你的鼓励
字节跳动Seed团队提出的虚拟宽度网络(VWN)通过解耦嵌入宽度与主干宽度,在几乎不增加计算成本的情况下显著提升模型表示能力。8倍虚拟宽度扩展使训练效率提升2.5-3.5倍,且发现虚拟宽度因子与损失呈对数线性关系,为大模型效率优化开辟新维度。
亚马逊研究团队通过测试15个AI模型发现,当AI助手记住用户背景信息时,会对相同情感情况产生不同理解,称为"个性化陷阱"。优势社会地位用户获得更准确的情感解释,而弱势群体接受质量较低的理解。这种系统性偏见可能在心理健康、教育等领域放大社会不平等,提醒我们需要在追求AI个性化的同时确保算法公平性。
两家公司在OverdriveAI峰会上分享了AI应用经验。Verizon拥有超过1000个AI模型,用于预测客户呼叫原因和提供个性化服务,将AI推向边缘计算。Collectors则利用AI识别收藏品真伪,将每张卡片的鉴定时间从7分钟缩短至7秒,估值从8.5亿美元增长至43亿美元。
微软等机构联合研发了DOCREWARD文档奖励模型,专门评估文档的结构布局和视觉风格专业度。该模型基于包含11.7万对文档的大规模数据集训练,在人类偏好准确性测试中超越GPT-5达19.4个百分点。研究解决了现有AI工作流忽视文档视觉呈现的问题,为智能文档生成和专业化排版提供了新的技术方案。