在发布第一款基于Nvidia Pascal架构的裸机GPU产品的6个月后,Oracle于本周二宣布基于Volta架构的裸机Tesla GPU全面上市。
除了提供新的裸机产品(第一批采用8个Volta GPU)之外,Oracle云基础架构部门还推出了更多深度学习和高性能计算工具,这些工具利用Volta体系结构,以及新的设计和工程应用。
Oracle预计,这些产品将吸引可以采用Oracle云,因为这些产品不仅在价格方面具有竞争力,而且Oracle本身也重点关注的是企业客户,Oracle云产品和战略高级总监Leo Leung这样表示。
他说:“我们所打造的一起,都使企业能够轻松移动现有应用并创建新的应用。专注于能够移动现有应用,这一点与其他云是有很大区别的,这相对内部部署的运营方式来说非常具有竞争力。”
这款裸机GPU产品具有8个Tesla V100 GPU、768 GB内存和512 TB块存储,价格为每小时2.25美元。目前这些产品已经在Oracle美国阿什本地区推出,并计划在不久的将来扩张到全球范围。这是在美国和欧洲地区提供先前发布的计算实例基础之上,Oracle提供了两个基于Pascal的Tesla GPU。
Leung提到了一家客户Yellow Dog,来展示裸机GPU如何帮助企业和各个行业开创新的商业模式。作为动画公司和娱乐工作室的代理公司,Yellow Dog可高效地提供渲染即服务。他们的工作是以项目为主导的,这迫使他们必须全速运转,例如运行100台机器完成一项工作。以前,动画公司通常不得不投资购买服务器来完成一部漫画——这对于像Yellow Dog这样的公司来说是没有意义的资本支出。
Leung说:“我们认为这对于习惯于在云中运行计算的客户以及那些开始在云越来越多地作项目的企业来说,都是一个巨大的机会,不管是针对项目还是在整个应用。”
除了裸机产品之外,Oracle还宣布限量提供Nvidia GPU Cloud(NGC),包括基于Pascal和Volta的计算产品。 NGC为研究人员和数据科学家提供了容器化的深度学习框架,以及一系列GPU优化的深度学习和高性能计算软件工具。
最后,Oracle还在Oracle Cloud Infrastructure上为GPU加速图形提供有限的NVIDIA GRID。GRID使客户能够将其当作一个功能强大的桌面来使用,用于运行不同的应用集。Oracle正在与Citrix合作,让客户可以运行Citrix的XenApp和XenDesktop,此外Teradici也将支持Teradici Cloud Access软件用于Oracle的GPU实例。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。