扩散模型 关键字列表
超越GPT架构:谷歌扩散模型或将重塑大语言模型部署方式

超越GPT架构:谷歌扩散模型或将重塑大语言模型部署方式

谷歌DeepMind推出实验性研究模型Gemini Diffusion,采用扩散方法生成文本,打破传统大语言模型依赖自回归逐词生成的模式。该技术从随机噪声开始,逐步细化为连贯输出,显著提升生成速度至每秒1000-2000个令牌,是Gemini 2.5 Flash的3-7倍。扩散模型支持并行处理、自我纠错和非因果推理,在编程和数学任务中表现出色。虽然在多语言和推理能力上仍有差距,但该技术为实时对话AI、代码辅助等低延迟应用带来巨大潜力,标志着语言模型架构的重要变革。

Inception 从秘密研发中推出新型 AI 模型

Inception 从秘密研发中推出新型 AI 模型

Inception是一家位于帕洛阿尔托的新公司,由斯坦福大学计算机科学教授Stefano Ermon创立,声称开发了一种基于“扩散”技术的新型AI模型,称为扩散基础的大型语言模型(DLM)。目前备受关注的生成AI模型大致可分为两类:大型语言模型(LLMs)和扩散模型。Inception的模型结合了传统LLMs的功能,如代码生成和问答,但性能显著更快,计算成本更低。

一秒钟实现移动图像中任何物体!Meta提出新的分层可控文生图模型!

一秒钟实现移动图像中任何物体!Meta提出新的分层可控文生图模型!

可控场景生成(即生成具有可重新排列布局的图 像的任务)是生成建模的一个重要课题 [16, 34],其应 用范围包括社交媒体平台的内容生成和编辑,以及互 动式室内设计和视频游戏。