2020年3月3日,北京——英特尔、联想以及华大基因今天宣布,三家公司正携手加快COVID-19新型冠状病毒的基因组特性分析。来自英特尔及联想的专业技术与生命科学专家将通力合作,为华大基因的研究人员提供全新的大数据分析技术和计算资源,进一步提升其基因测序工具的分析能力,更高效地研究新型冠状病毒的基因组特性。
英特尔和联想携手为华大基因提供的技术包括一个大型高性能计算集群,可用于处理从华大DNBSEQ-T7测序系统读取的高通量数据。华大基因的研究人员将能够通过全新的高性能计算和基因组分析技术,以及英特尔和联想的相关资源和专业知识,进一步加速他们对新型冠状病毒的基因组特性研究。该技术将支持科学家研究病毒的毒性、传播模式、病原体与宿主间的相互作用,进而助力流行病学及疫苗设计研究。这些工作对于未来创建更好的诊断方法和设计有效的疫苗或其他保护性措施(例如免疫疗法)是非常必要的。
通过这项合作,华大基因将得以继续优化其新型冠状病毒检测试剂盒并获取大量有价值的信息。这些信息将有助于确定将来开发有效疫苗或治疗方法的潜在靶标。通过英特尔和联想的共同努力,联想的超算技术支持并优化了“基因组优化和可扩展性工具”,(简称GOAST,首个获得英特尔®精选解决方案验证的基因组分析工具),可为全基因组测序和全外显子测序的计算提供高达40倍I的加速,助力华大基因优化计算过程,高效处理数据,更快地生成可靠的基因组分析成果,从而缩短科研和临床观察的时间。
“目前我们对这个新型冠状病毒还有很多不了解的地方。华大基因通过分析病毒基因组数据,加速对感染者的快速识别和基因组特性的研究,而这些工作需要投入巨大的计算资源,这恰恰是我们可以发挥作用的地方。”英特尔市场营销集团副总裁兼中国区总经理王锐表示,“因此,我们紧密携手,为正在防疫一线进行病毒研究的科学家提供更多的计算资源和专业支持,希望与狡猾的病毒赛跑,助力疫情防控,拯救更多生命。”
联想集团高级副总裁、企业科技集团总裁童夫尧表示:“新型冠状病毒肺炎的疫情牵动着全国人民的心。联想作为全球领先的HPC厂商,一直致力于为生命科学研究提供计算力支持。来自英特尔及联想的大数据分析和健康与生命科学方面的专家,将整合我们的资源及专业技术,帮助解决目前面临的严峻挑战,推动健康和生命科学的发展进程。”
在基因测序工作中,每毫升体液通常会包含数百万个不同的病毒体,而每个病毒体的基因组则包含大约30,000个DNA碱基或字母。华大基因正在对许多感染患者和疑似感染患者的微生物进行基因测序,因此这些研究工作将会生成TB级乃至PB级的海量数据。要想高效地快速处理这些重要数据,就需要采用更为先进的HPC基础架构、计算技术以及优化的基因组分析方法。
华大基因总部位于深圳,是全球领先的专注于生命科学和基因研究的公司之一。 华大基因首席信息官晋向前表示:“华大基因已对数百份临床样本进行了测序,以分析和区分感染的并发症。生物信息学领域的技术,例如基因组比对、基因组组装、基因组注释和病毒核酸片段的系统分析,是一个高密度的计算过程,因此足够的高性能计算对于提高分析效率至关重要。能够使用最新的高性能计算和基因组分析技术是提高分析效率的重要因素。该设备和技术将加快对新型冠状病毒感染者的快速识别和病毒基因组特性的研究,为新型冠状病毒的精准诊断、治疗和疫情防控提供强有力的支持。”
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。