AI 革命如火如荼,为企业带来新的机遇,每次客户互动、每件产品和每项服务都将融入 AI 并借助 AI 实现改进。多年来,GPU 已经证明能够非常有效地解决某些极为复杂的深度学习问题,而且 NVIDIA 深度学习平台也逐渐成为业界标准的训练解决方案,但其推理能力并非广为人知。早在 2016 年 NVIDIA 就推出了支持高性能深度学习推理加速引擎 —— TensorRT。
TensorRT 是一个高性能的深度学习推理(Inference)优化器。经过几个版本的迭代,TensorRT 可以为深度学习应用提供低延迟、高吞吐率的部署推理。为了让更多的 AI 开发者们迅速掌握 NVIDIA 高性能加速工具 TensorRT,2021 年 3 月20 日,NVIDIA 联合阿里云和英迈中国,面向全国开发者们发起 TensorRT 加速 AI 推理 Hackathon 2021 大赛。
本次大赛吸引了 56 支队伍 247 名选手参与报名,经过方案初选,共有 37 支队伍入围决赛,入围团队有来自知名互联网公司、无人驾驶方案公司、智能家电公司,也有来自高等院校及研究单位。在接下来的 20 多天时间里,参赛团队利用 TensorRT 工具,在阿里云提供的 GPU 云平台上完成优化自己所选深度学习模型的比赛任务。
同时,NVIDIA 组建了一支由工程师组成的导师团队,为每个参赛队伍配备了 2 名NVIDIA 开发工程师,在线指导参赛队员利用 TensorRT 优化和部署模型。
4 月 30 日,所有参赛队伍提交代码托管平台链接和项目报告书,并通过在线的方式向导师演示阿里云平台的数据测试结果。紧接着,NVIDIA 组织核心技术评审团队,通过 TensorRT 加速技术路线比较、性能比较、创新性、可扩展性及实用性等几个方面考察每个团队的参赛模型。最终于 5 月 21 日公布比赛结果。
NVIDIA 开发与技术亚太区总监,同时也是本次大赛评审团负责人李曦鹏说:“第一届 TensorRT Hackathon 大赛非常精彩,我们看到了不少眼前一亮的模型方案。有几个队伍甚至发现了 TensorRT 的 bug,可以协助我们完善 TensorRT 的开发工作。”
李曦鹏表示,“人工智能应用场景创新日新月异,AI 模型的开发与部署也需要注入了新的动能。NVIDIA 构建 TensorRT 的初衷就是为了进一步将人工智能推向更为广阔的应用场景。今天,看到各位参赛选手们基于 TensorRT 加速引擎挖掘出了更多的潜能和功能需求,我感到非常开心和激动。不忘初心,牢记使命,我们希望与更多优秀的开发者们一起,共同推进 TensorRT 的发展,让 AI 在 GPU 上更容易、更高效地部署。”
很多参赛队伍均表达了在参赛过程中有导师指导的重要性。来自佳讯飞鸿智能科技研究院的团队负责人表示:"在 NVIDIA 导师的帮助下,提高了自己对 TensorRT 的认识,对于模型落地,又有了新的思路。”
来自上海高重科技有限公司,也是本次大赛一等奖团队成员表示:“很不错的一次实践体验,感谢 NVIDIA 的导师和组织者,从前期的基础知识培训到项目的具体实施,对自己的成长很有帮助。”
来自香港理工大学的团队负责人表示:“很棒的比赛,让我们的科研与实践能力都得到锻炼,希望以后还能有更多类似的比赛。”
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。