近日,“‘芯’系数医融合 ‘智’创健康未来”2023中关村论坛系列活动暨英特尔智能医疗健康创新合作论坛在京举行。在医疗行业加速数字化转型的大背景下,英特尔中国研究院携手“医产学研用”合作伙伴,共同探讨如何推动数医融合创新,助力“健康中国”建设,并分享技术解决方案和相关落地实践。
科技革命重塑医疗结构体系
首都医科大学急诊医学系主任、北京朝阳医院急诊中心主任郭树彬表示,科技革命正在重塑整个医疗结构体系。医院所面临的巨大挑战是,如何快速认识和了解科技革命对医疗带来的冲击,把科技的最新成果应用于临床实践。
“新医科”是国家的“四新”战略之一,新医科就是科技革命与IoT、互联网等各类技术,与传统专业的深度融合,进行全面的转化、转型。数字化转型和智能化发展是推动转型的源动力。
在未来的健康医疗体系下,我们每一个人能够借助于网络实时连接解决医疗相关的问题。在实现连接的基础上,如何形成院前、院中、院后连续的医疗体系构建,这是目前比较迫切的问题。
去年,首都医科大学附属北京朝阳医院和英特尔中国研究院达成战略合作协议,基于英特尔中国研究院提供的新型传感技术,交互技术及CPU、GPU、AI和FPGA等计算平台,以急诊医学需求为切入点,以智能机器人为载体,将健康管理、急救及康复应用延伸至家庭、社区、机构、高校等场景。
科技赋能医疗,替代医生进行那些重复性工作或者是模式化的工作。英特尔研究院副总裁、英特尔中国研究院院长宋继强表示,在过去这十来年,英特尔中国研究院每一个阶段都在用相对最新最可用的技术赋能医疗健康行业。
在硬件层面,英特尔医疗信息领域的技术方案提高整个部署的性价比,也降低能耗。英特尔构建未来数字化转型的数字化底座,包括各种各样类型的芯片。未来,类脑计算、量子计算是新的计算形态,它会带来新的算力的能效比的发展以及各种新的计算范式的转变。
在软件方面,英特尔提供混合智能的框架,包括分布式的异构计算系统、异构计算编程框架、人工智能管理框架,结合边缘计算和客户端计算,oneAPI软件框架让异构编程向未来兼容,降低软件的投资,避免重复开发。
混合边缘智能把AI的能力通过边缘计算的方式,软硬结合地进行部署。例如“无界”医疗技术平台实现了数字人、生成式AI、虚拟现实、数字孪生等技术融合。
宋继强说,院内院外,跨越不同时间地域的诊疗不是某一个技术点的问题,而是一个整体方案,包括端到端的延迟、数据隐私的保护、用户体验,乃至让解决方案的整个开发能够面向未来兼容,这些问题都要解决。“英特尔的优势在于多维度上的技术积累,实现面向现在和未来的硬件发展、系统演进和软件兼容。”
“无界”医疗技术创新平台
产业需求与先进技术形成一个完整的,端到端的概念验证的原型,如何把它变成一个可以工作的系统,并且满足系统的实时性等要求,这个相对来说是比较困难的,因为它不只是一个技术点。
英特尔中国研究院聚焦视觉理解与视觉合成,应用英特尔软硬件,从云到边缘,包括新的传感器的引入和智能算法的加持,搭建基于数字人、虚拟现实、生成式AI技术的远程医疗系统。
在活动上,英特尔中国研究院,联合首都医科大学附属北京朝阳医院、同济大学数字创新中心、泰安市中心医院和英麒智能发布了新一代“无界”医疗技术创新平台。该平台聚焦防诊治康能力,覆盖诊前诊中诊后多领域,在数字人、数字孪生、自由视角视频等英特尔中国研究院先进技术,和英特尔异构硬件强大算力的支持下,提供端到端系统方案,为医生和患者带来便捷、高效、沉浸式的远程沟通体验。
郭树彬表示,“无界”诊室是朝阳医院和英特尔合作的一个方面,“无界”诊室的意义让医患之间的联系更紧密,任何人在任何时间、任何地点,都可以借助无界诊室触达医疗体系,“无界”诊室可以帮助进行院外的咨询、随诊甚至是初诊。这改变了现有的医疗诊断模式,开启了一个新的居家诊疗、线上诊疗的模式。
“无界”诊室可以使诊室开到千家万户,开到每个人身边,时时刻刻都有诊室,这能在很大程度上缓解现在到医院挂号看病难和看病不方便的情况。“未来的医疗可能会是无差别医疗,即使是位于偏远地区的患者,只要网络所及、软件装上,医疗资源发达地区的专家教授就可以为他们诊断。”郭树彬说。
除了这些工作之外,“无界”诊室还将引入数字分身,基于数据模型和资源,对患者建立预警模型和预诊模型,这可能给医疗的效率、体系、能力、结构带来巨大的改变。
英特尔中国研究院副院长,数字医疗健康实验室总监王鹏表示,在英特尔搭建的框架、体系之中,各个合作方之间可以形成一个闭环,促进整个智能医疗生态的发展。
智能医疗的蓬勃发展离不开技术与生态。英特尔中国研究院将继续秉持英特尔中国“植根中国、服务中国、共同发展”的理念,发挥在技术、资源等方面的优势,推进整个医疗生态的更广泛合作,与各界伙伴一起打造本地化的数医融合解决方案,让医护服务更人性化、更有温度。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。