过去几年以来,英特尔公司一直不遗余力地强调其进军离散GPU市场的计划,目标自然是阻击已经在消费级PC以及数据中心领域大放异彩的AMD与英伟达显卡。从历史角度来看,英特尔公司其实习惯于藏起前瞻性产品的细节信息,并在临近上市时突然公布,从而获得爆炸式的宣传效果。但作为GPU市场上的后发者,英特尔与PC游戏以及技术爱好者社区进行了直接接触,解答并提出关于离散GPU计划的问题,甚至先后披露了上市策略、下一代GPU架构、即将实现的功能与性能目标乃至未来显卡设计的渲染图。这一系列操作下来,实在让人有点不太适应。
英特尔离散GPU概念图。
英特尔曾经表示,计划在2020年年内正式进军离散GPU市场。为此,芯片巨头当然需要提前准备,确保已经完成能够接受验证测试与试用的内部可用芯片方案。就目前来看,英特尔方面似乎做好了战斗准备。事实上,在最近的财报电话会议上,英特尔公司CEO Bob Swan确认了其下一代离散GPU(从技术角度讲,这也是英特尔首款离散GPU)已经完成工厂试生产并开始接受初步通电验证。
在会议当中,Swan表示“今年第三季度,我们还发布了首款10纳米Agilex FPGA。2020年,我们将继续通过多款振奋人心的新产品扩展10纳米产品组合,其中包括AI推理加速器、5G基站SOC、用于服务器存储及网络的至强CPU,外加一款离散GPU。本季度,我们已经成功完成了首款离散GPU,即DG1的通电测试。”Swan又进一步补充称,这一成就堪称“重要的发展里程碑”。
几个月之前,泄露的英特尔显卡驱动程序信息让我们得以一窥下一代Rocket Lake处理器的真容,其指向的正是第12代英特尔GPU。当时,人们猜测新一代GPU将包含128到512个处理单元,用于提供低功耗与高功耗两种图形解决方案。其中一款GPU将带有DG1标识,因此目前芯片巨头强调的离散解决方案可能正是上述设计的一款衍生产品。当然,作为第一款离散GPU,DG1有可能只是入门级产品,甚至是单纯的开发工作。
就在Swan发布声明的同时,Twitter上也出现了英特尔图形技术团队几位主要成员的神秘推文。英特尔公司高级副总裁、首席架构师兼架构、图形与软件总经理Raja Koduri在Twitter上发文称,“ It’s been quite a Dash”。有人猜测,大写Dash中的“D”肯定有着某种含义。截至目前,大多数关注者已经认定DG1代表的是“离散GPU 1号”,但D也有可能代表Dash、也就是破折号。英特尔公司图形与视觉技术高层总监Chris Hook则在推文中指出,“它活了!”这显然是取自小说《弗兰肯斯坦》中,科学怪人在通电后获得生命的重要瞬间。
英特尔公司图形技术与产品集团副总裁Ari Rauch则就离散GPU发表了多条推文,他的表述可就直白多了。一条推文提到,“我为我们工程技术团队达成的DG1发展里程碑感到自豪。我们还有很长的路要走,但现在的这一步无疑至关重要。”其他英特尔人士也发表了类似的观点。
英特尔公司Ari Rauch接连发推。
由于Swan在今年第三季度(截至9月30日)的财报电话会议上披露了DG1项目,我们可以假定英特尔已经在10月之前完成了这款离散GPU的开机通电验证。换句话说,又是近一个月过去,英特尔方面可能已经开始在该GPU上运行3D应用进行实际测试。当然,这一切都只是猜测。
无论实际情况如何,英特尔公司的离解GPU计划确实在不断推进;而且几乎可以肯定的是,目前的所有努力,都是为了实现芯片巨头定下的2020年发布离散Xe GPU的目标。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。