当我们感到皮肤不适时,仅需通过手机拍摄一张患处照片,很快就能得到可靠的诊断结果,实现皮肤病的自诊、预诊。在医院里,当医生忙不过来时,只需将患者皮肤图像上传到系统,即可获取可信的辅助诊断意见……
这是南开大学“皮肤健康卫士”项目团队首创性提出、基于移动端图像的皮肤病大规模可信综合辅助诊断系统:用户只需简单的通过移动端设备拍摄病例患处样本,图片经过动态加密后上传至系统,经过云端AI多算法共同决策,最终回传给用户可靠可信的综合诊断结果。

我国每年有近1.5亿人患有不同程度的皮肤病,门诊患者数量更是达到了3亿人次之多。但是,我国的皮肤科医生数量仅有两万余名,医患比例达到了惊人的1:7000。在皮肤病的诊断过程中,有两项挑战亟待解决:一是诊断必须依赖皮肤镜等专用设备,耗时长、费用高、效率低;二是常见皮肤病如痤疮、皮炎特征明显,患者通过一定诊断依据有望实现自诊和预诊。“皮肤健康卫士”团队解决了这两项核心挑战:自研全新的三套世界领先诊断算法和两个大规模数据集,基于皮肤科医生临床ABCD诊断法、多任务学习方法和基于极少样本罕见病的平衡自步学习方法,实现了面向皮肤病智能诊断应用场景的智慧医疗创新解决方案。用户只需使用移动端图像即可进行安全、可靠、可信的皮肤病诊断,提高了医疗机构的服务能力,减轻了其压力,为广大人民群众提供了皮肤健康保障。
由南开大学几位硕博学生组成的团队,依靠这一成果,拿下了2022年“互联网+”大学生创新创业大赛全国银奖。他们参加的是由华为提供的“基于昇思MindSpore的智慧医疗创新解决方案”产业赛道命题,在智慧医疗这个方向上,聚焦皮肤病的智能诊疗,实现了一个大规模可信辅助诊断系统。
题目要求使用昇思MindSpore AI框架,这是华为开源的全场景自主人工智能框架,适用于端、边、云多业务场景,具有开发友好、运行高效、部署灵活等诸多优点,通过动静态图的支持,加速AI开发灵活调测与执行;最重要的是,昇思强大的可信AI机制高度符合医疗数据隐私性的需求。
团队指导老师、天津市媒体计算技术工程研究中心副主任、南开大学计算机学院杨巨峰教授介绍说,项目为医生提供辅助诊断的建议,为病患提供自诊支撑。创新之处可以分为数据与算法两大部分,数据方面,高质量的移动端皮肤病图片数据为算法训练提供支持,我们在世界上首次提出了两个新的皮肤病移动端图像公开临床数据集,数据规模位居世界第一。算法方面,我们首先聚焦通用皮肤病诊断算法,并对常见皮肤病和罕见皮肤病分别设计了诊断算法,实现决策互补,提高准确率。算法原理来源于临床医学,使得最终的诊断结果可靠可信,值得医生信赖。
项目团队负责人、南开大学在读硕士研究生刘佳烜介绍说,“昇思具有简洁的API接口,特别是训练流程中的API清晰好用,还具有庞大的算法库作为支持,为我们项目的开发提供了极大的助力。除此之外,昇思也具有完善的生态环境和充满活力的社区氛围,开发者们都非常热情,乐于助人,不仅为我们的算法开发提供了帮助,更是让我们看到了国产深度学习框架的强大活力。”
在比赛过程中,项目遇到的最大难点是如何设计决策互补算法,综合考虑三个诊断算法的结果。刘佳烜认为,决策互补算法并不是简单的几行代码,需要兼顾算法性能与医学可解释性。基于这个问题,团队首先基于南开大学计算机视觉实验室在皮肤病智能诊断领域积累五年的深厚经验,在技术层面做了大量实验,对不同情况下的决策方式进行了分别设计,随后咨询了医院对接的合作团队,结合专业医学意见进行了第二轮调整,最终完成了完善的综合决策系统。
刘佳烜介绍说,他们计划继续深化与华为的全方位合作,与华为健康深度融合。“作为以‘爱国奋斗、公能日新’为价值追求的南开人,为国家和社会贡献新时代青年的力量!”
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。