2017年诺贝尔化学奖颁给了“在开发用于溶液中生物分子高分辨率结构测定的冷冻电镜技术方面的贡献”的三位科学家。如今,这项荣获最新诺贝尔奖的成果“冷冻电镜”的科学应用成为全球最大超算竞赛ASC18的赛题,来自全球超过300支大学生队伍将在接下来几个月内完成这项世界顶尖科学成就的应用挑战——冷冻电镜三维重构软件Relion的计算优化。
冷冻电镜是重要的结构生物学研究方法,目的是为了获得核酸和蛋白等生物大分子的结构,进而阐释其功能机制。在过去的两年时间里,冷冻电镜技术完成了自上世纪70年代以来最大的技术飞跃,相比X射线晶体衍射技术和核磁共振技术,冷冻电镜技术的优势在于能够更好的保存生物大分子的结构完整性,并且获得高清晰度的三维图像。利用这项技术,科学家们可以更深入的研究各类生物大分子结构,探寻生命活动的规律,从而理解生命。
冷冻电镜技术主要包含三大环节,首先需要对样品进行快速冷冻,使蛋白质和所在的水溶液环境迅速从溶液态转变为玻璃态,玻璃态能使蛋白质结构保持其天然结构状态。随后通过冷冻成像来保存样品的高分辨率结构信息,并获取二维投影图像。最后,利用三维重构将二维图像通过计算得到三维密度图。
对于冷冻电镜技术来说,技术难点远非单纯冷冻,冷冻成像和图像处理算法一直都是瓶颈。冷冻电镜技术从生物大分子溶液的冷冻-玻璃化开始,需要以高通量的方式收集数以千计的高质量冷冻电镜显微照片,随后的图像处理包括显微照片校正和评估,对比度传递函数(CTF)估计,粒子选取和排序,二维和三维分类,定向精化和重建以及后处理,这需要先进的计算资源配合有效的算法才能实现。从冷冻电镜技术诞生以来的近30年时间里,快速高效的图像处理算法包括三维重构一直是这个领域内最大的计算挑战。
ASC18赛题提供了一个人类载脂蛋白铁蛋白的冷冻电镜数据集,要求参赛队伍采用最新的超算技术使用冷冻电镜领域最通用的软件Relion对排序后的粒子图像执行2D分类、3D分类、3D模型重构任务。这道赛题的挑战在于,参赛队员们需要在保证最终3.3埃米分辨率的前提下尽可能降低计算时间。参赛队伍需要提交的文件包括一篇关于超算系统环境如硬件平台、操作系统、并行库、数学库的介绍和评估与优化方法的说明文档,以及Relion的输出文件2D分类图像、3D分类图像和3D重构图像。
ASC世界大学生超级计算机竞赛(ASC Student Supercomputer Challenge)是由中国发起的世界最大规模的大学生超算竞赛,发韧于2012年,经过7年发展,影响力不断攀升。迄今为止,ASC 竞赛已吸引到全球超过 5500 名年轻人才参与,参赛队伍总数超过1100支。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。