至顶网服务器频道 05月15日 新闻消息(文/李祥敬):目前精准医学发展进程不断提速,高通量基因医疗检测正逐渐成为炙手可热的诊疗手段。在HPC技术的推动下,测序数据的处理已变得越来越高效。高通量测序成本不断下降,测序市场不断扩张,基因测序正在从个体走向大规模群体,正在从科研走向民生应用。
基因测序是精准医疗的前置技术,通过对全基因组、转录组或蛋白质组的变异进行分析,对特定疾病类型进行生物标记物的分析与鉴定,从而推断疾病的原因及治疗靶点,个别情况下甚至能直接对用药进行指导。而在这个过程中,大量测序数据的分析和处理非常关键。比如一个人的完整基因序列需要由数十万的基因片段 拼接而成,只能借助HPC来完成,拼接结果的准确程度、拼接的速度都与HPC提供的计算力息息相关。此外,对基因数据的比对、分析从而确诊以及新药研发等等,都离不开HPC技术的支撑。与此同时,人工智能也正在为医疗行业带来革命性的改变。
在这样的背景下,浪潮与北京诺禾致源科技股份有限公司(以下简称诺禾致源)开展了众多合作,浪潮人工智能与高性能团队持续提供了软硬件方面的支持,在诺禾致源成为精准医疗行业领袖的过程中,为其创新赋能。
作为目前国内基因测序领域的佼佼者,诺禾致源的业务覆盖科技服务、肿瘤基因检测及遗传检测三大领域,为全球研究型大学、科研院所、医院、医药研发企业、农业企业等提供基因测序、质谱分析和生物信息技术支持等服务。
诺禾致源目前拥有全球领先的高性能计算平台和数据中心,目前物理核数25000余个,计算峰值速度约1727T flops,总内存约410TB,总存储约60.2PB,有效地支撑了生命科学研究和医疗健康两大领域对大数据分析和存储的需求。诺禾云(NovoCloud)即为诺禾致源以助力生物测序行业大数据的分析运算为目标,搭建的生物信息数字化平台,为生物科学领域海量数据的研究提供超强计算能力和大容量储存服务。
诺禾致源副总经理田仕林
诺禾致源副总经理田仕林告诉记者,在诺禾云的基础平台搭建过程中,需要可拓展的数据中心硬件支持,生物数据将是公司的财富和未来机会所在。随着数据计算和存储在公司的业务中所占比例越来越大,公司需要一个强有力的合作伙伴助力公司未来发展,减少可能存在的技术瓶颈,这也成为诺禾致源与浪潮深入展开合作的契机。
浪潮AI&HPC总经理刘军
浪潮AI&HPC总经理刘军表示,在诺禾致源的业务发展中,需要持续不断优化硬件的结构以匹配急剧增长的数据量,在运营中持续研讨相应的并行算法和软件硬件配合调优,以配合超摩尔定律增长的测序数据。浪潮与诺禾致源在软硬件方面进行多方面的合作,帮助其解决业务发展中的技术难题。
当前,随着高通量测序技术的飞速发展,测序数据量得到大幅提升,这为后端的基因数据分析处理带来很大挑战。田仕林表示,起初,诺禾致源使用通用计算CPU承载数据分析,后来随着数据通量的大规模增长,逐渐开始采用FPGA和GPU,通过异构计算解决数据分析问题。多元化的底层IT构架为下游分析服务奠定了扎实基础,同特定的生物信息分析流程一起,构建形成一个完整的数据获得-解读-应用闭环。
浪潮基于英特尔的基因领域集成解决方案BIGstack的新一代基因一体机就被诺禾致源采用,该一体机融合了英特尔最新可扩展处理器与FPGA协处理器,提供更好的用户体验和出色的性能,解决基因分析的效率问题,加速精准医疗发展。
刘军说,为了帮助诺禾致源解决数据挑战,浪潮从计算、存储到整体系统架构进行联合创新,不断提升计算力,加快数据处理的速度和品质。“浪潮的主业是计算,我们要服务好客户,而不是仅仅提供一个硬件设备,我们要深入行业,洞察客户的痛点,帮助他们迎接挑战,解决问题,推动行业发展。”
事实上,浪潮并未止步于以HPC推动医学进步。随着人工智能技术的发展,浪潮已经开始探索AI在医学上的应用。刘军认为,如果说HPC为医学带来了飞跃式发展,那么AI+HPC对医学领域的改造将是颠覆式的,将从生产力上对传统医疗行业带来改变。
人工智能在医学领域的应用有手术机器人、医学影像诊断到远程医疗等,主要用于医疗诊断、辅助治疗与健康管理、药物研发,其中医学影像是当前人工智能与医学结合度最好的领域之一。超过80%的医疗数据来自医学影像数据,而且非常重要的一点是这些数据的标准化程度非常高,便于机器阅读学习。医学影像智能分析是建立深度神经网络医学模型,然后把经过标注的数据对模型进行训练,出现误差后调整模型参数,再辅助以医学知识,通过大量的训练之后形成精准的医学辅助诊断模型,从而完成医学影像的判读,其识别准确率高,极大降低医学误诊率,并能大幅提高医疗效率。
田仕林也表示,诺禾致源也在探索AI在业务中的应用,“以前我们把计算平台作为一个载体,现在随着数据的增加,可以在精准医学应用方面进行更多创新。比如在遗传检测方面诺禾致源已开发一系列基于二代测序技术的检测服务,包括孕前基因检测,新生儿基因筛查,个人基因组等产品。这些产品和服务更多是基于数据集进行提供,AI在其中可以发挥很大的作用。”
刘军表示,目前,浪潮已从设计AI业务流程入手,帮助用户选择深度学习模型,测试验证识别精度。同时,经过优化的AI训练与推理性能,也能够解决数据处理和训练中的瓶颈。“未来,浪潮和诺禾致源将持续联合双方优势,共同解决精准医疗中涌现出的前沿技术问题,为人类健康信息事业发展尽力。”
好文章,需要你的鼓励
K Prize是由Databricks和Perplexity联合创始人推出的AI编程挑战赛,首轮比赛结果显示,获胜者巴西工程师Eduardo Rocha de Andrade仅答对7.5%的题目就获得5万美元奖金。该测试基于GitHub真实问题,采用定时提交系统防止针对性训练,与SWE-Bench 75%的最高得分形成鲜明对比。创始人承诺向首个在该测试中得分超过90%的开源模型提供100万美元奖励。
T-Tech公司研究团队开发了SAE Boost助推器系统,通过训练专门的"错误补偿器"来增强AI理解工具对专业领域的理解能力。该系统在化学、俄语和外交等领域测试中显示出显著改进效果,同时完全保持原有通用能力。这种模块化设计为AI系统的持续优化提供了安全可靠的路径,对AI可解释性研究具有重要意义。
阿里巴巴通义千问团队发布开源编程模型Qwen3-Coder-480B-A35B-Instruct,专门用于软件开发辅助。该模型采用混合专家架构,拥有4800亿参数,支持25.6万token上下文长度,可在数秒内创建完整功能应用。在SWE-bench基准测试中得分67.0%,表现优于GPT-4和Gemini。模型基于Apache 2.0开源许可,企业可免费使用。AI研究者称其可能是目前最佳编程模型,特别适合企业级代码库理解、自动化代码审查和CI/CD系统集成。
斯坦福大学研究团队开发出革命性AI系统,能够像生物学家一样"看懂"蛋白质三维结构并预测功能。该系统通过多层次分析方法,在蛋白质功能预测方面达到90%以上准确率,为新药开发和精准医疗开辟新道路。这项技术不仅加速了蛋白质研究进程,更为解决复杂疾病提供了强大的AI助手,预示着人工智能与生物医学融合的美好前景。