在发布第一款基于Nvidia Pascal架构的裸机GPU产品的6个月后,Oracle于本周二宣布基于Volta架构的裸机Tesla GPU全面上市。
除了提供新的裸机产品(第一批采用8个Volta GPU)之外,Oracle云基础架构部门还推出了更多深度学习和高性能计算工具,这些工具利用Volta体系结构,以及新的设计和工程应用。
Oracle预计,这些产品将吸引可以采用Oracle云,因为这些产品不仅在价格方面具有竞争力,而且Oracle本身也重点关注的是企业客户,Oracle云产品和战略高级总监Leo Leung这样表示。
他说:“我们所打造的一起,都使企业能够轻松移动现有应用并创建新的应用。专注于能够移动现有应用,这一点与其他云是有很大区别的,这相对内部部署的运营方式来说非常具有竞争力。”
这款裸机GPU产品具有8个Tesla V100 GPU、768 GB内存和512 TB块存储,价格为每小时2.25美元。目前这些产品已经在Oracle美国阿什本地区推出,并计划在不久的将来扩张到全球范围。这是在美国和欧洲地区提供先前发布的计算实例基础之上,Oracle提供了两个基于Pascal的Tesla GPU。
Leung提到了一家客户Yellow Dog,来展示裸机GPU如何帮助企业和各个行业开创新的商业模式。作为动画公司和娱乐工作室的代理公司,Yellow Dog可高效地提供渲染即服务。他们的工作是以项目为主导的,这迫使他们必须全速运转,例如运行100台机器完成一项工作。以前,动画公司通常不得不投资购买服务器来完成一部漫画——这对于像Yellow Dog这样的公司来说是没有意义的资本支出。
Leung说:“我们认为这对于习惯于在云中运行计算的客户以及那些开始在云越来越多地作项目的企业来说,都是一个巨大的机会,不管是针对项目还是在整个应用。”
除了裸机产品之外,Oracle还宣布限量提供Nvidia GPU Cloud(NGC),包括基于Pascal和Volta的计算产品。 NGC为研究人员和数据科学家提供了容器化的深度学习框架,以及一系列GPU优化的深度学习和高性能计算软件工具。
最后,Oracle还在Oracle Cloud Infrastructure上为GPU加速图形提供有限的NVIDIA GRID。GRID使客户能够将其当作一个功能强大的桌面来使用,用于运行不同的应用集。Oracle正在与Citrix合作,让客户可以运行Citrix的XenApp和XenDesktop,此外Teradici也将支持Teradici Cloud Access软件用于Oracle的GPU实例。
好文章,需要你的鼓励
ETH Zürich等机构研究人员提出TrustVLM框架,解决视觉-语言模型预测可信度问题。该方法利用模型中存在的"模态差距",创新性地结合图像到文本和图像到图像的相似度,实现无需重新训练即可大幅提升误分类检测性能。在17个数据集的严格测试中,TrustVLM相比现有方法在关键指标上提升显著,同时改善了零样本分类准确率。此成果为AI系统在自动驾驶、医疗等安全关键领域的可靠部署提供了重要保障。
这项研究提出了个性化安全概念,解决大语言模型对不同用户采用统一安全标准的问题。研究团队创建了PENGUIN基准测试集评估模型在处理高风险场景时的个性化安全能力,并开发了RAISE框架高效获取关键用户信息。实验表明,提供用户背景可使安全分数提高43.2%,而RAISE框架通过平均仅2.7次交互即可提高安全分数31.6%。这一创新方法将AI安全从"一刀切"转向"个性定制",为高风险领域的AI应用提供了新思路。
明尼苏达大学研究团队提出了一种创新方法,通过回合级信誉分配显著提升大语言模型(LLM)智能体的多回合推理能力。传统方法只对整个过程进行评价,而他们的MT-GRPO算法能够精确评估每个决策步骤的价值,就像为每一步提供具体反馈。在维基百科搜索工具使用场景中,该方法实现了100%的工具执行成功率和50%的答案精确匹配率,远超传统方法。这一突破不仅提高了AI在多步骤任务中的表现,也为开发更复杂的AI系统提供了重要思路。
这篇研究介绍了PISCES——一种能精确从大语言模型参数中移除特定概念知识的创新技术。与现有方法不同,PISCES通过解缠器模型识别概念相关特征,直接编辑模型参数,实现了更精准的知识移除。在Gemma和Llama模型上的测试表明,该方法不仅有效降低了目标概念的准确率(低至7.7%),还保持了模型在无关领域的高性能,并显著提高了对"重新学习"的抵抗力。这一突破为AI系统的安全部署和合规使用提供了新的可能性。