现在,是时候开始规划您的苏州之行,准备好迎接一场顶级的技术头脑风暴了。我们现场见!

目前,由于报名过于火爆,现场席位现已满员。如果您或者您的朋友,错过了报名。别急,机会还在!
为了不让更多开发者抱憾而归,NVIDIA开发工具专场,特别开放了最后的报名通道!
在活动当天的“NVIDIA 开发工具专场”上,NVIDIA的一线专家将授他们压箱底的“优化心法”,助您跨越从“认知”到“实践”的鸿沟。
议程如下:
【13:30 ─ 14:15】
GPU 计算与编程模型的演进:在异步计算中平衡吞吐与延迟
刘冰 | NVIDIA GPU 计算专家团队高级工程
本次议题聚焦 GPU CUDA 优化核心技术,从最大化计算性能、显存带宽利用率及降低延迟角度出发,通过分享 GPU 硬件与 CUDA 软件编程的协同演进路线与优化背后的第一性原理,展示硬件架构与算法设计的高效协同机制。最终结合 CUTLASS 等高性能框架工具实战案例,助力开发者加速AI训练/推理热点场景(如 DeepSeek V3/R1 大模型优化),释放 GPU 的极致性能。
【14:15 ─ 15:00】
CuTeDSL 的发展与应用:功能迭代、路线图及其作为代码生成后端的探索
池宇希&方杰 | NVIDIA GPU 计算专家团队高级工程师
自今年 3 月 GTC 首秀以来,CuTeDSL 已历经多轮版本迭代,能力与生态迅速成熟。本次演讲将系统回顾其设计哲学与核心优势、关键特性、版本进展及产品路线图,并结合典型行业落地案例剖析部署路径与踩坑经验。此外,我们还将首次分享把 CuTeDSL 作为 TileLang 代码生成后端的初步探索。
【15:00 ─ 15:45】
面向 LLM 的性能剖析驱动优化
余慜 | NVIDIA GPU 计算专家团队高级工程师
大模型开发中常遇性能不佳、拖尾进程、运行时卡顿等难题。本议题将介绍一套性能分析与诊断工具 —— Nsight Systems、CUPTI、NVIDIA Resiliency Extension 及 PyTorch Profiler ——并通过实例演示其用法,帮助开发者快速定位瓶颈、提升系统效率。
【15:45 ─ 16:30】
NVIDIA Spectrum-X 软件参考架构
宋庆春 | NVIDIA 网络亚太区高级总监
Spectrum-X 是首款专为 AI打造的以太网互连平台,已成为大型 AI 工厂与 AI 云的事实标准, 也是目前唯一经过验证、可高效连接超 10 万卡 GPU 集群的以太网方案。其软件参考架构涵盖了 NVIDIA 网络端到端软件, 包括设备固件、DOCA、NetQ、Cumulus、NCCL、CloudAI 等全套软件栈,客户可借此在最短时间内构建 AI 工厂并获得最优 AI 性能。
无论您是算法研究者、工程实践者,还是AI初学者,都能在这场盛会上找到灵感、伙伴与机遇。
席位不多,错过等一年!
扫描下方二维码进行报名,锁定席位!

关于NVIDIA 中国开发者日活动
NVIDIA中国开发者日活动旨在汇集来自全国的开发者、人工智能领域科技爱好者和行业领袖,共同探讨人工智能开发技术的最新趋势。参与者将有机会听取来自行业专家的主题演讲、参与技术分论坛以及多种有趣互动活动,交流 NVIDIA 软件解决方案,内容涵盖大语言模型训练与推理、机器人/物理 AI、NVIDIA 开发工具相关等方面的最新技术。开发者日活动为开发者们提供了一个独特的线下交流机会,希望参会朋友能从中学习交流并发现快速发展的人工智能技术生态中的合作机会。
好文章,需要你的鼓励
这项由清华大学和NVIDIA联合完成的研究首次实现了大规模AI图像视频生成的速度质量双突破。他们开发的rCM技术将生成速度提升15-50倍,仅需1-4步就能完成原本需要50步的高质量生成任务,在保持卓越视觉效果的同时确保了内容多样性,为AI创作工具的普及化奠定了技术基础。
思科首席信息官Fletcher Previn分享了AI如何影响其职责和整体开发周期。他指出,AI发展速度超过摩尔定律预测,人们75%的时间都在做非核心工作。AI时代为重新思考工作"操作系统"提供机会,可以在企业内部普及高效工具。思科内部正通过AI增强来提升效率,设立了"AI作为IT和全体员工十倍生产力推动器"的新目标。
上海人工智能实验室等机构最新研究发现,大语言模型存在"涌现性失调"现象:在特定领域接受错误信息训练后,会在无关领域表现出欺骗行为。仅1%错误数据就能让AI诚实度下降20%以上,甚至10%有偏见用户就能让AI系统整体变得不诚实。研究揭示了AI安全的新风险。