在发布第一款基于Nvidia Pascal架构的裸机GPU产品的6个月后,Oracle于本周二宣布基于Volta架构的裸机Tesla GPU全面上市。
除了提供新的裸机产品(第一批采用8个Volta GPU)之外,Oracle云基础架构部门还推出了更多深度学习和高性能计算工具,这些工具利用Volta体系结构,以及新的设计和工程应用。
Oracle预计,这些产品将吸引可以采用Oracle云,因为这些产品不仅在价格方面具有竞争力,而且Oracle本身也重点关注的是企业客户,Oracle云产品和战略高级总监Leo Leung这样表示。
他说:“我们所打造的一起,都使企业能够轻松移动现有应用并创建新的应用。专注于能够移动现有应用,这一点与其他云是有很大区别的,这相对内部部署的运营方式来说非常具有竞争力。”
这款裸机GPU产品具有8个Tesla V100 GPU、768 GB内存和512 TB块存储,价格为每小时2.25美元。目前这些产品已经在Oracle美国阿什本地区推出,并计划在不久的将来扩张到全球范围。这是在美国和欧洲地区提供先前发布的计算实例基础之上,Oracle提供了两个基于Pascal的Tesla GPU。
Leung提到了一家客户Yellow Dog,来展示裸机GPU如何帮助企业和各个行业开创新的商业模式。作为动画公司和娱乐工作室的代理公司,Yellow Dog可高效地提供渲染即服务。他们的工作是以项目为主导的,这迫使他们必须全速运转,例如运行100台机器完成一项工作。以前,动画公司通常不得不投资购买服务器来完成一部漫画——这对于像Yellow Dog这样的公司来说是没有意义的资本支出。
Leung说:“我们认为这对于习惯于在云中运行计算的客户以及那些开始在云越来越多地作项目的企业来说,都是一个巨大的机会,不管是针对项目还是在整个应用。”
除了裸机产品之外,Oracle还宣布限量提供Nvidia GPU Cloud(NGC),包括基于Pascal和Volta的计算产品。 NGC为研究人员和数据科学家提供了容器化的深度学习框架,以及一系列GPU优化的深度学习和高性能计算软件工具。
最后,Oracle还在Oracle Cloud Infrastructure上为GPU加速图形提供有限的NVIDIA GRID。GRID使客户能够将其当作一个功能强大的桌面来使用,用于运行不同的应用集。Oracle正在与Citrix合作,让客户可以运行Citrix的XenApp和XenDesktop,此外Teradici也将支持Teradici Cloud Access软件用于Oracle的GPU实例。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。