图中显示为Habana Labs的HL-205 Gaudi夹层卡。基于Gaudi的EC2实例可提供卓越的成本效益和高性能,且同时原生支持TensorFlow、 PyTorch等通用框架。(图片来源:Habana Labs)
新闻:在近日举行的AWS re:Invent 2020(亚马逊 re:Invent 2020)大会上,AWS首席执行官Andy Jassy宣布了采用最多8个Habana® Gaudi®加速器的EC2实例。对于机器学习工作负载,这些全新EC2实例的性价比相较目前基于GPU的EC2实例提升高达40%。Gaudi加速器专为训练深度学习模型而设计,适用于自然语言处理、对象检测和机器学习训练、分类、推荐以及个性化等工作负载。
“我们为AWS选择Habana Gaudi处理器用于其即将推出的EC2训练实例感到自豪。Habana团队期待继续与AWS展开合作,为客户持续提供确保连续性及先进性的产品路线图。”——David Dahan,英特尔公司旗下Habana Labs首席执行官
重要性:作为全球领先的云服务提供商,AWS被全球各地的开发者用于训练其人工智能模型。然而,机器学习模型复杂程度的增加推升了训练所需的时间和成本,特别是在越来越多的数据可用、且开发者寻求改进其模型的情况下。基于Gaudi的EC2实例旨在通过交付高成本效益及高性能,并同时原生支持TensorFlow和PyTorch等通用框架,来满足这些需求。借助Habana的SynapseAI软件套件,开发者将能够轻松地构建新的训练模型或将现有训练模型从GPU移植到Gaudi加速器。
英特尔的人工智能和XPU愿景:英特尔在2019年收购了Habana,并借此推进其人工智能战略,加强其面向云和数据中心的人工智能加速器产品组合。这包含一系列支持商业、社会及科研领域最具前景的人工智能应用场景的产品和技术。这也体现了公司面向提供全面的跨CPU、GPU、FPGA等的XPU架构并以此帮助客户和整个生态系统释放数据潜能的转型。
英特尔数据平台事业部首席战略官Remi El-Ouazzane表示:“我们的产品组合反应了人工智能并非是能用一种解决方案来满足所有场景的计算挑战。云服务提供商目前已广泛采用了内置人工智能性能的英特尔®至强®处理器来应对人工智能推理工作负载。通过Habana,我们现在得以帮助他们降低人工智能模型的大规模训练成本,在高增长的市场机遇中提供极富竞争力的替代选择。”
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。