加州大学旧金山分校(UCSF)、辛辛那提儿童医院和初创企业 Qure.ai等医学影像领域的领先企业和机构借助 MONAI Deploy,将研究突破应用于临床。
为大规模地提供 AI 加速的医疗服务,医疗机构需要让成千上万的神经网络一同工作,以应对人体生理学、所有疾病,甚至医院运营等方方面面的相关工作,而这在如今的智能医院环境中是一项重大的挑战。
MONAI 是一个采用 NVIDIA 技术加速的开源医学影像 AI 框架,其下载量目前已超 65 万次。借助 MONAI 应用包(MAP),MONAI 就能更轻松地将模型集成到临床工作流中。
MAP通过 MONAI Deploy 提供,其作为一种 AI 模型的打包方式,能够更轻松地在现有医疗生态系统中进行部署。
辛辛那提儿童医院的 Ryan Moore 博士表示:“如果想要在影像部门部署几个 AI 模型来帮助专家识别十几种不同的病症或实现医学影像报告的半自动化创建,需要耗费大量时间和资源来为每个模型寻求合适的硬件和软件基础设施。这在过去虽然‘可能’,但并不 ‘可行’。”
MAP 能够简化这一流程。如果开发者使用 MONAI Deploy 应用软件开发工具包来打包一个应用,医院就可以轻松地在本地或云端运行这一应用。MAP 规格还整合了医疗 IT 标准,比如医学影像互操作性标准 DICOM 等。
伦敦医学影像与 AI 中心 Value-Based Healthcare 项目首席技术官 Jorge Cardoso 表示:“目前,大多数 AI 模型一直处于研发阶段,很少能够真正用于患者护理。MONAI Deploy 将有助于推动研发成果落地,实现更具影响力的临床 AI。”
MONAI Deploy 得到医院和医疗初创企业的采用
世界各地的医疗机构、学术医疗中心和 AI 软件开发商正在采用 MONAI Deploy,包括:
将医学影像 AI 部署到 MAP
MAP规格由 MONAI Deploy 工作组制定。该工作组由来自十几家医学影像机构的专家组成,目标是支持 AI 应用开发者以及运行 AI 应用的临床和基础设施平台。
对于开发者来说,MAP 可以帮助研究者在临床环境中轻松打包和测试模型,从而加速 AI 模型的演进。这使他们能够采集真实世界的反馈,进而对 AI 进行完善和改进。
对于云服务商来说,对(使用云原生技术设计的) MAP 的支持能够助力采用 MONAI Deploy 的研究者和企业通过容器或原生应用集成,在自己的平台上运行 AI 应用。整合 MONAI Deploy 和 MAP 的云平台包括:
着手使用MONAI。关注本周的RSNA大会,了解NVIDIA如何助力构建AI医学影像生态系统。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。