Nvidia日前开始禁止在数据中心使用GeForce和Titan游戏显卡,从而迫使一众机构购买昂贵的设备,比如最新的Tesla V100芯片。
芯片设计巨头Nvidia前几天更新了旗下的GeForce和Titan软件许可,新条款含:“不可部署在数据中心。该软件许可不含数据中心部署,在数据中心的区块链处理使用除外。”
换句话说,如果你想在一个服务器机箱里整一堆GeForce GPU,并用其来加速用了很多数学的软件(比如机器学习、模拟和分析等),呃……那就违反了与Nvidia之间许可协议,除非你正在做与流行的区块链相关的东西。
说得准确一点,有争议的最终用户许可协议(EULA)条款涵盖的是NVIDIA GeForce GTX和Titan显卡的驱动程序。不过,没有Nvidia的专有驱动程序,硬件的全部潜力就不能释放出来,所以,用户是逃不出NVIDIA的手心的。
数据中心禁用GTX和Titan不仅仅对想打造自己的服务器和数据中心的人是一个打击,也是对计算机制造商(如HPE或戴尔)的一个打击,这些计算机制造商希望使用GTX或Titan硬件运行GPU加速服务器,如果能用GTX或Titan就会比昂贵的DGX系列GPU加速服务器的Nvidia收费便宜得多。来自Nvidia、配备了Tesla V100芯片的DGX-1售价约为15万美元。 使用GeForce或Titan的盒子的价格要低得多,尽管处理能力也要小得多。
高端的GeForce GTX 1080 Ti显卡(针对的是游戏玩家而不是深度学习数据科学家)使用的是Nv的Pascal架构,售价仅为699美元。而数据中心最新用到的Tesla V100卡的花费超过9000美元。
64位双精度浮点数学计算方面,V100绝杀1080 Ti:V100拥有大约7TFLOPS,而GeForce的表亲只有0.355 TFLOPS。同样,V100在使用32位单精度浮点运算和16位半精度浮点运算的视频游戏方面也十分了得。顶级的GeForce Titan Xp同样由V100统领。
一位支持学术医学研究机构的高级技术人员注意到了许可证的变化并通知了笔者,他表示,做研究的人不一定需要强大的Tesla,玩家级别图形处理器有时已经足够了,最终取决于所做的工作类型和可用预算。
他告诉笔者,“这可能会对那些使用成本较低的GPU处理数据的研究机构产生巨大的影响。”
他表示,“这些数据的大部分实际上并不需要双精度Tesla卡。但现在突然以这种不太正大光明的方式给他们的产品带来限制,有点令人震惊。实际上,大多数地方都会很开心地认可在服务器中使用消费产品可能会令保修单失效,但现在却以这样的方式限制,令研究人员受到可能的法律威胁,坦率地说,颇为令人不快。“
Nvidia一位发言人告诉记者,许可证的调整是为了阻止GeForce和Titan芯片在“要求苛刻的大型企业环境中”被“滥用”。换句话说,Nv认为游戏卡不适合闷热、拥挤、有需求和资金充足的服务器仓库。该发言人表示:
GeForce和TITAN GPU设计的目标从来不是用于数据中心部署,数据中心部署要用到全天候运行的复杂硬件、软件及有散热方面的需求,运作时通常使用多堆栈机架。为了清楚地表明这一点,我们最近在GeForce专用EULA中增加了一项规定,目的是防止在苛刻的大规模企业环境中滥用我们的GeForce和TITAN产品。
NVIDIA利用我们的Tesla产品解决了服务器对这些独特的机械、物理、管理、功能、可靠性和可用性的需求,包括三年的质保,涵盖数据中心工作负载、NVIDIA企业级支持、供货连续性保证以及数据中心组件更长的SKU预期寿命。自Tesla产品首次发布以来,这些信息已经传达给了市场。
如果有人在数据中心安装游戏级图形处理器违反许可证的话,Nvidia会不会采取法律行动呢? Nvidia声称不打算禁止非商业用途和研究。
总部设在美国加州的芯片架构设计商Nvidia发言人表示,“我们知道研究人员经常将GeForce和TITAN产品用于非商业用途或其他研究用途,其规模不属于数据中心运作。 NVIDIA不打算禁止这一类用途。”
我们曾要求Nvidia澄清数据中心的定义是什么,发言人承认“数据中心有很多种类”。
该发言人表示,“数据中心与用于公司和学术研究项目的个人电脑和小型局域网相比之下,数据中心通常是大规模部署,通常置于多服务器机架之中,会为许多用户提供对长久在线的GPU访问。”
目前看来,如果Nvidia发现有人违反许可证规则,Nvidia就会对其发出严厉警告及要求这些人掏出支票本,不然的话……。
该发言人称,“只要我们发现我们的驱动程序的实际使用或建议使用与EULA相违背,NVIDIA就会采取措施,我们会与用户一起了解每个未经许可使用的原因,我们会努力评估个案,看看如何才能在不影响我们的硬件和软件性能和可靠性标准的情况下最好地满足用户的需求。”
发言人表示,“用户使用GeForce或者TITAN驱动程序时,只要方式上可能未被授权,他们都应该联系NVIDIA的企业销售部门,对这些具体的使用和潜在的选择进行讨论。我们希望能与我们的用户群一起讨论每个具体的使用案例,我们希望能够解决客户的任何疑虑。”
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。