德尚韵兴医疗科技有限公司(德尚韵兴)正在应用英特尔®软件保护拓展(英特尔®SGX)和英特尔®oneAPI数学核心函数库(oneMKL),在边缘的医疗设备上保护其医疗人工智能算法和知识产权。作为中国人工智能超声技术研发的领导者,德尚韵兴采用其自主开发的深度学习框架DE-Light,在开源框架下该框架展现出了卓越的性能,将甲状腺结节检测的准确率提高了30-40%。
英特尔公司市场营销集团副总裁兼中国区行业解决方案部总经理梁雅莉表示,“基于医疗行业的特点,很多时候人工智能厂商不得不在客户端部署其解决方案,因此对厂商的核心智力资产——人工智能模型进行保护,已成为迫切需求。基于英特尔 SGX 技术的可信执行环境技术已成为性价比最高、能提供运行时保护的可行解决方案。在英特尔的支持下,德尚韵兴将 SGX 技术战略性地应用在包括其超声人工智能产品在内的一系列人工智能产品上,大大提升了其市场竞争力和创新能力。”
现阶段,超声波成像诊断和分析被广泛使用,是医疗诊断和治疗的重要组成部分。但影像检查和分析在很大程度上取决于医生的经验,且效率较低。
而人工智能在医学中的最大价值在于其能够快速分析大量数据并获得准确结果。通过使影像诊断智能化,诊断与分析中的AI技术正在帮助医疗机构加速检测和治疗。医生可以提高读片效率,降低误诊的可能性并获得诊断辅助,而患者则可以获得更准确的诊断建议和个性化的治疗建议。
德尚韵兴的AI医疗应用产品已成功在国内400多家医院中部署,并计划在未来一年中于1000多家医院中进行推广和部署。
德尚韵兴推出了用于超声成像的AI-SONIC™计算机辅助诊断系统,还开发了更多使用英特尔SGX来保护算法的人工智能产品。在超声AI模型解决方案中,为了确保英特尔SGX中的算法可以充分利用英特尔®处理器的计算能力,项目团队在利用英特尔® C++ 编译器的基础上,亦人工优化了在oneMKL上构建的算法浮点矩阵乘法的核心计算。
oneMKL是针对英特尔及其兼容处理器进行高度优化的并行数学函数库。在不同的操作环境中,oneMKL可以进行自动运行时处理器检测,从而对不同的处理器运行不同的优化版本的程序,从而保证其能在所运行的处理器上都能获得较好的性能。英特尔®oneAPI数学核心函数库(oneMKL)和英特尔®oneAPI深度神经网络库(oneDNN)为常用深度学习框架和众多自行开发的AI应用提供基础支持。
英特尔软件保护拓展是一个指令集,可提高应用程序代码和数据的安全性,更好地防止它们泄露或被修改。开发者可以将敏感信息划分到基于硬件的可信执行环境(TEE)或安全区域中,即内存中安全保护级别更高的区域。该技术有助于确保信任源仅限于中央处理单元硬件的一小部分,从而更好地保护代码和数据的机密性和完整性。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。