近日,2022中华医院信息网络大会(CHINC)在深圳举办,浪潮信息存储产品线副总经理刘希猛在会上发表了《新存致远,数聚向新》主题演讲。浪潮信息坚持以客户为中心,持续加强在医疗卫生领域的投入,为医疗机构打造场景化、个性化数据基础设施。目前,浪潮存储已经为全国数百家大型医疗机构构建了数据基础设施,其中中国Top100医院,近半数选择了浪潮存储。
浪潮存储 服务中国数百家医疗机构
释放数据之力 提速智慧医疗
伴随医疗数字化飞速发展,国内主要医疗机构都进行了卓有成效的数字化建设,医疗大数据、互联网+医院、医共体等新应用的兴起使得海量医疗数据不断产生,IDC发布的《数字宇宙驱动医疗行业数据增长》报告显示,医疗行业在数字宇宙中占比显著,数据量每年以48%的速度增长,是增速最快的行业之一,这对医疗的数据存储基座提出了挑战。
在关键业务领域,承载院内信息中心大量核心业务系统的数据存储可谓是至关重要。中国部分大型医院,年门诊量超过200万人次,日均门诊量超过8000人次,HIS、LIS、RIS、EMR等核心生产业务每天会产生大量的业务数据。数据存储的稳定可靠与性能高低,直接决定着智慧医疗建设的可持续性。
在临床影像领域,CT、彩超、核磁、手术机器人等设备,目标就是病症可视,让“看不见”的人体器官呈现在医生面前。然而,随着医疗影像设备越来越精密、精细,对数据存储设备带来了挑战——
一方面,医院影像数据增长快速。以协和为代表的TOP医院每年产生上亿张影像,影像数据年增量达到PB级。同时,影像数据需要长期留存,按照国家卫健委对影像数据存储要求,PACS影像门诊数据需要保存不得少于15年,住院数据需要保存不得少于30年。因此,需要建设数十年影像数据保存的建设方案,保证需要的时候能快速进行影像的获取。
另一方面,影像访问实时性要求高。影像业务的特点是连续写、顺序读。当前,患者拍一次三维CT影像检查就会获取数千幅切片、数据量能达到10GB,影像数据实时写入对存储带宽提出了挑战。而PACS影像以单序列单线程读取,每序列200至1000张切片,要求单影像序列首幅加载时间小于3秒,单线程每秒超50幅影像,这就考验存储设备对海量小文件的处理能力,如果性能不够,医生调阅影像就容易出现卡顿、马赛克,影响阅片体验。
在医疗行业数字化转型中,透过HIS、PACS这些典型应用,折射出数据存储对于医疗数字化的重要意义。刘希猛认为,就整个医疗行业来看,未来医疗将向三个方面转变:面向患者,从过去的“以疾病为中心”转向“以患者健康为中心”;面向医护,从“信息共享”向“高级辅助决策”演进;面向医管,从“普适性”科研攻关向打造“高精尖”的医疗数字化应用演进。这三个转变,都需要数据存储基座来发挥更大支撑作用。
既稳又快 为智慧医疗打造存储基座
面对医疗数字化转型,浪潮存储基于通过“全闪存储和分布式存储”提供安全可靠、绿色高效的智慧医疗数据基础设施,为医院的数据融合、患者就医体验提升、远程医疗服务等夯实了基础,助力医院智慧医疗建设走得既稳又快。
浪潮存储
首先,HIS、LIS等核心业务对安全可靠有着永恒的追求。为了让诊疗行为不中断、业务操作不卡顿、安全威胁不担忧,浪潮基于集中式全闪存储提供了医疗双活存储解决方案,能够在单台存储发生故障时,将业务自动转移到其他正常的存储设备,实现前端业务无感知运行。同时,浪潮全闪存储还具有业界领先的性能,高端全闪产品在SPC-1国际评测中以超2300万IOPS夺得性能全球第一,能够高效支撑大型医院的峰值业务,提升患者就医体验。
其次,在PACS影像存储系统建设中,浪潮存储基于分布式存储提供在线、近线、离线的分级存储方案,在线部分部署高性能分布式存储节点,通过性能较高的SSD和SAS HDD硬盘混插,并采用小文件聚合技术,将医疗影像海量小文件访问性能提升5倍,实现百亿级文件快速检索。对于影像数据的归档,则部署高密度分布式存储节点,采用低成本、大容量的 SATA 盘,在充分满足了医院影像PACS系统的数据存储需求的同时,降低了 TCO。
目前,浪潮存储出货容量位居全球前三、中国第一,已经在同仁医院、天坛医院、上海瑞金医院、齐鲁医院、郑大一附院、湘雅医院、武汉中南医院、武汉协和医院等大型医院提供了支撑和保障。未来,浪潮基于“存储即平台”战略,将持续加大数据存储核心技术研发投入,释放数据要素价值加速医疗数字化转型。
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。