现在,是时候开始规划您的苏州之行,准备好迎接一场顶级的技术头脑风暴了。我们现场见!

目前,由于报名过于火爆,现场席位现已满员。如果您或者您的朋友,错过了报名。别急,机会还在!
为了不让更多开发者抱憾而归,NVIDIA开发工具专场,特别开放了最后的报名通道!
在活动当天的“NVIDIA 开发工具专场”上,NVIDIA的一线专家将授他们压箱底的“优化心法”,助您跨越从“认知”到“实践”的鸿沟。
议程如下:
【13:30 ─ 14:15】
GPU 计算与编程模型的演进:在异步计算中平衡吞吐与延迟
刘冰 | NVIDIA GPU 计算专家团队高级工程
本次议题聚焦 GPU CUDA 优化核心技术,从最大化计算性能、显存带宽利用率及降低延迟角度出发,通过分享 GPU 硬件与 CUDA 软件编程的协同演进路线与优化背后的第一性原理,展示硬件架构与算法设计的高效协同机制。最终结合 CUTLASS 等高性能框架工具实战案例,助力开发者加速AI训练/推理热点场景(如 DeepSeek V3/R1 大模型优化),释放 GPU 的极致性能。
【14:15 ─ 15:00】
CuTeDSL 的发展与应用:功能迭代、路线图及其作为代码生成后端的探索
池宇希&方杰 | NVIDIA GPU 计算专家团队高级工程师
自今年 3 月 GTC 首秀以来,CuTeDSL 已历经多轮版本迭代,能力与生态迅速成熟。本次演讲将系统回顾其设计哲学与核心优势、关键特性、版本进展及产品路线图,并结合典型行业落地案例剖析部署路径与踩坑经验。此外,我们还将首次分享把 CuTeDSL 作为 TileLang 代码生成后端的初步探索。
【15:00 ─ 15:45】
面向 LLM 的性能剖析驱动优化
余慜 | NVIDIA GPU 计算专家团队高级工程师
大模型开发中常遇性能不佳、拖尾进程、运行时卡顿等难题。本议题将介绍一套性能分析与诊断工具 —— Nsight Systems、CUPTI、NVIDIA Resiliency Extension 及 PyTorch Profiler ——并通过实例演示其用法,帮助开发者快速定位瓶颈、提升系统效率。
【15:45 ─ 16:30】
NVIDIA Spectrum-X 软件参考架构
宋庆春 | NVIDIA 网络亚太区高级总监
Spectrum-X 是首款专为 AI打造的以太网互连平台,已成为大型 AI 工厂与 AI 云的事实标准, 也是目前唯一经过验证、可高效连接超 10 万卡 GPU 集群的以太网方案。其软件参考架构涵盖了 NVIDIA 网络端到端软件, 包括设备固件、DOCA、NetQ、Cumulus、NCCL、CloudAI 等全套软件栈,客户可借此在最短时间内构建 AI 工厂并获得最优 AI 性能。
无论您是算法研究者、工程实践者,还是AI初学者,都能在这场盛会上找到灵感、伙伴与机遇。
席位不多,错过等一年!
扫描下方二维码进行报名,锁定席位!

关于NVIDIA 中国开发者日活动
NVIDIA中国开发者日活动旨在汇集来自全国的开发者、人工智能领域科技爱好者和行业领袖,共同探讨人工智能开发技术的最新趋势。参与者将有机会听取来自行业专家的主题演讲、参与技术分论坛以及多种有趣互动活动,交流 NVIDIA 软件解决方案,内容涵盖大语言模型训练与推理、机器人/物理 AI、NVIDIA 开发工具相关等方面的最新技术。开发者日活动为开发者们提供了一个独特的线下交流机会,希望参会朋友能从中学习交流并发现快速发展的人工智能技术生态中的合作机会。
好文章,需要你的鼓励
埃森哲投资AI零售平台Profitmind,该平台通过智能代理自动化定价决策、库存管理和规划。研究显示AI驱动了2025年假日购物季20%的消费,约2620亿美元。部署AI代理的企业假日销售同比增长6.2%,而未部署的仅增长3.9%。Profitmind实时监控竞争对手价格和营销策略,并可创建生成式引擎优化产品文案。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
日立公司在CES 2026技术展上宣布了重新定义人工智能未来的"里程碑式"战略,将AI直接应用于关键物理基础设施。该公司与英伟达、谷歌云建立重要合作伙伴关系,并扩展其数字资产管理平台HMAX,旨在将AI引入社会基础设施,变革能源、交通和工业基础设施领域。日立强调其独特地位,能够将AI集成到直接影响社会的系统中,解决可持续发展、安全和效率方面的紧迫挑战。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。