在GPU无法满足复杂数据集要求的情况下,英特尔通过其基于CPU的解决方案提供检测结果。
Madhu Nair博士和Asha Das博士即将取得巨大突破,即利用人工智能(AI)模型在从患者组织样本中获取的扫描图像中检测乳腺癌细胞。
然而,这两位来自印度的研究人员面临着巨大的挑战。通常,他们需要花费数月的时间,艰难地教他们的AI模型去准确地识别癌细胞。而Das与她的团队经常需要耗费数周来审阅高分辨率、百万像素的图像,并逐一标记出癌变区域。
因此,该团队需要一个能够在无人监督的情况下,准确、快速扫描这些图像的解决方案。
针对这种情况,英特尔提供了帮助。
2022年,来自印度科钦科技大学人工智能与计算机视觉实验室的研究人员Madhu Nair博士和Asha Das博士与英特尔工程、销售及市场团队展开合作,利用英特尔®至强®可扩展处理器,以及充分利用英特尔CPU加速功能的英特尔® TensorFlow优化软件套件,打造了一个全新的解决方案。
高需求之下,GPU力有不逮
目前,乳腺癌早期迹象的发现很大程度上依赖于放射科医生以及负责手动扫描组织病理学结果医生的专业知识。然而,仅仅依靠人眼存在弊端。根据美国国家癌症研究所的数据,约20%的乳腺癌迹象正在被遗漏。
而AI在这方面可以提供很好的帮助。随着近期算力技术的突破,越来越多的医院开始热衷于使用AI来发现医生可能错过的迹象。12月,英特尔与宾夕法尼亚大学医学院联合宣布,其已帮助研究人员将癌性脑瘤的检测率提高了33%。
Das表示,她的团队首先采用了基于GPU的解决方案以提升其深度学习模型。然而,他们发现,由于处理大型图像所需的计算量远远超过了系统的设计极限,其基于GPU的系统经常会卡顿,甚至毫无原因地出现死机或重启的情况,令人十分沮丧。
"我们的模型在计算上要求很高,我们试图用GPU来训练模型的尝试以失败告终",Nair写道,"我们耗费了数日进行执行,并且发现GPU很难完成更高分辨率图像的训练,因此,我们不得不探寻更好的计算设施"。
英特尔通过硬件及软件提供服务
2022年,Nair发现了英特尔或许能够提供帮助。当时,他与一位戴尔员工正在就另一个研究项目进行会面,Nair提出了他所面临的挑战,而戴尔则将Nair介绍给了英特尔印度团队。
几个月后,他们部署了四台服务器,在没有任何深度学习加速器的情况下,作为单一的计算集群运行。这些服务器和存储使用高速以太网网络进行连接。
在软件方面,该联合团队采用了英特尔® TensorFlow优化,该软件套件通过利用英特尔CPU的加速功能来提升TensorFlow的性能。
"我与英特尔团队分享了我们的问题,非常高兴他们迅速理解了这项工作的重要性",Nair表示,"他们给了我们使用这种分布式架构的机会。"
Asha Das博士,印度科钦科技大学人工智能与计算机视觉实验室的研究员。利用英特尔的硬件和软件,其与Madhu Nair博士打造了基于CPU的解决方案,能够在医疗图像上检测出乳腺癌的早期迹象。
Madhu Nair博士,印度科钦科技大学人工智能与计算机视觉实验室的研究员。利用英特尔的硬件和软件,其与Asha Das博士打造了基于CPU的解决方案,能够在医疗图像上检测出乳腺癌的早期迹象。
新的解决方案不仅准确而且快速
这些结果正是研究人员所期待的,而且还有一个超乎预期的收获:他们的模型不仅能标记出癌细胞,还能区分出不同等级的癌症。
而且它非常准确:该解决方案达到了98%的准确率--比其他模型好约10个百分点。(了解更多关于该解决方案的信息:CUSAT通过深度学习改善癌症筛查结果)。
这是个一开始就设定的高标准。
此后,该团队在更多的数据集上训练其模型,研究人员预计这一准确率将逐步上升。
"英特尔的架构非常‘神奇’",Nair表示,"我们能够在几个小时内完成训练,这其中有很多原因。因为服务器有192GB的内存,比显卡上的40GB或80GB还要多,而且我们能够使用高分辨率的图像,并将整个模型装入内存。此外,英特尔还帮助我们改进模型,并与我们共同优化,以保证其正常运行。"
Das指出,考虑到相较于其他模型所需的训练数据要少得多,这一准确性结果更加令人印象深刻,而且极大缩短了反馈时间。她补充道:“我们对结果非常满意。”
"我们能够在只拥有20%被注释数据的情况下,收获98%的准确率,这很了不起,而且很令人兴奋。"
即将在你身边的病理中心出现
接下来,对于这项技术而言,团队将等待以确保能获得专利,并与愿意颠覆一个习惯于人工干预的市场领域的商业合作伙伴达成合作。对此,Das分享了一些可能需要咨询多位病理学家的扫描结果,每位病理学家根据他们不同的经验提供自己的结论。
还有一个问题是准确性。虽然98%的准确率可能看起来很高,但对于实际应用来说,它依然不够精确。
现在,Das和Nair都已经证明他们的模型能够可靠地检测乳腺癌细胞,他们正在研究将类似的方法,应用于脑动脉瘤和对内窥镜检查中的息肉分类。
Das指出:"我们还计划扩展这个模型,以检测多器官癌症",她补充说,因为乳腺癌经常扩散到手臂下的邻近淋巴结,所以她现在正在努力扩展这个解决方案,以分析淋巴结图像。
Nair表示:"我们很感谢英特尔的支持,而且也期待未来能展开更多类似的合作。"
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。