@全体已报名开发者，NVIDIA开发者日门票已“激活”！苏州之约，即将兑现！原创

2025年11月14日，年度AI技术盛宴——NVIDIA开发者日即将在苏州国际博览中心盛大开幕。

目前活动报名热度持续飙升，诸多报名成功者的确认邮件已正式发出，如果您也收到了确认邮件，那么恭喜，您的“入场券”已经激活！

现在，是时候开始规划您的苏州之行，准备好迎接一场顶级的技术头脑风暴了。我们现场见！

目前，由于报名过于火爆，现场席位现已满员。如果您或者您的朋友，错过了报名。别急，机会还在！

为了不让更多开发者抱憾而归，NVIDIA开发工具专场，特别开放了最后的报名通道！

在活动当天的“NVIDIA 开发工具专场”上，NVIDIA的一线专家将授他们压箱底的“优化心法”，助您跨越从“认知”到“实践”的鸿沟。

议程如下：

NVIDIA 开发工具专场

【13:30 ─ 14:15】

GPU 计算与编程模型的演进：在异步计算中平衡吞吐与延迟

刘冰 | NVIDIA GPU 计算专家团队高级工程

本次议题聚焦 GPU CUDA 优化核心技术，从最大化计算性能、显存带宽利用率及降低延迟角度出发，通过分享 GPU 硬件与 CUDA 软件编程的协同演进路线与优化背后的第一性原理，展示硬件架构与算法设计的高效协同机制。最终结合 CUTLASS 等高性能框架工具实战案例，助力开发者加速AI训练/推理热点场景（如 DeepSeek V3/R1 大模型优化），释放 GPU 的极致性能。

【14:15 ─ 15:00】

CuTeDSL 的发展与应用：功能迭代、路线图及其作为代码生成后端的探索

池宇希&方杰 | NVIDIA GPU 计算专家团队高级工程师

自今年 3 月 GTC 首秀以来，CuTeDSL 已历经多轮版本迭代，能力与生态迅速成熟。本次演讲将系统回顾其设计哲学与核心优势、关键特性、版本进展及产品路线图，并结合典型行业落地案例剖析部署路径与踩坑经验。此外，我们还将首次分享把 CuTeDSL 作为 TileLang 代码生成后端的初步探索。

【15:00 ─ 15:45】

面向 LLM 的性能剖析驱动优化

余慜 | NVIDIA GPU 计算专家团队高级工程师

大模型开发中常遇性能不佳、拖尾进程、运行时卡顿等难题。本议题将介绍一套性能分析与诊断工具 —— Nsight Systems、CUPTI、NVIDIA Resiliency Extension 及 PyTorch Profiler ——并通过实例演示其用法，帮助开发者快速定位瓶颈、提升系统效率。

【15:45 ─ 16:30】

NVIDIA Spectrum-X 软件参考架构

宋庆春 | NVIDIA 网络亚太区高级总监

Spectrum-X 是首款专为 AI打造的以太网互连平台，已成为大型 AI 工厂与 AI 云的事实标准, 也是目前唯一经过验证、可高效连接超 10 万卡 GPU 集群的以太网方案。其软件参考架构涵盖了 NVIDIA 网络端到端软件，包括设备固件、DOCA、NetQ、Cumulus、NCCL、CloudAI 等全套软件栈，客户可借此在最短时间内构建 AI 工厂并获得最优 AI 性能。

无论您是算法研究者、工程实践者，还是AI初学者，都能在这场盛会上找到灵感、伙伴与机遇。

席位不多，错过等一年！

扫描下方二维码进行报名，锁定席位！

关于NVIDIA 中国开发者日活动

NVIDIA中国开发者日活动旨在汇集来自全国的开发者、人工智能领域科技爱好者和行业领袖，共同探讨人工智能开发技术的最新趋势。参与者将有机会听取来自行业专家的主题演讲、参与技术分论坛以及多种有趣互动活动，交流 NVIDIA 软件解决方案，内容涵盖大语言模型训练与推理、机器人/物理 AI、NVIDIA 开发工具相关等方面的最新技术。开发者日活动为开发者们提供了一个独特的线下交流机会，希望参会朋友能从中学习交流并发现快速发展的人工智能技术生态中的合作机会。