9月27日,全球首创的开源数据编排软件开发商Alluxio与北京大学计算机学院举行产学研合作框架协议签约仪式。北京大学计算机学院刘譞哲研究员、金鑫研究员、马郓研究员,Alluxio创始人兼CEO李浩源、Chief of Staff 吕薇、中国区市场负责人沙鹏、中国区社区运营负责人王添钰出席了本次仪式。
双方签署产学研合作框架协议
此次Alluxio与北京大学计算机学院达成合作框架协议,双方将在学术研究、人才培养、联合实验室、开源社区共建等方面展开深入合作,并将成立“云原生数据编排服务系统联合实验室”。
刘譞哲表示,数字经济时代,数据作为重要生产要素,其价值发挥依赖于多源多维数据的融合碰撞和数据的共享流通,而系统软件则是核心基础支撑。近年来,Alluxio发展非常迅速,在云原生的数据编排和分布式文件系统方面建立了很好的技术和应用积累,特别是在开源社区及其生态建设领域作出了积极贡献,与北京大学系统软件团队的研究方向高度一致,双方具有很好的合作基础。特别值得一提的是,Alluxio创始人李浩源博士是北大计算机的优秀校友,他高度评价李博士带领Alluxio取得的成就,尤其是李博士长期致力于开源软件的情怀。
此次达成战略合作协议,双方将就面向云原生的新一代系统软件关键技术开展深度合作和联合研发,力争在开源软件生态建设、学术论文、课程实践、推广应用等方面产出高质量的合作成果,为中国培养出更多优秀的系统软件人才。
Alluxio创始人兼CEO李浩源谈到,很高兴在燕园最美的时间重返母校,见到这么多老师和同学们,有熟悉的面孔也有新鲜的血液。长期以来,他一直跟学校的老师和同学们进行了很多有意思的分享和交流。大家最常问到的问题之一就是为什么要将一项核心技术开源。这两年,在全球化趋势下,开源正以“开放、共享、协同+商业模式”的新型生产方式,通过“自由”的传播,成为推动全球科技发展的核心引擎。在中国,2021年,“开源”首次被明确列入了“十四五”规划。开源已经从国家战略层面得到充分的支持,其价值正在被越来越多的领域所认可。Alluxio项目从一开始就被深深植入了开源的基因,全球社区的发展也是一直本着开放、平等、协作、共享的理念,持续不断地吸引了一大批来自全球各个国家的优秀开发者参与其中。开源的方式也促进了教育和科研事业的发展,为高校师生提供了更多自主学习的资源,学生能够直接、迅速地加入开源项目中,技术水平不断提高,经验不断丰富。借此合作机会,他衷心期待能够和母校一起,就软件定义的基础设施平台的未来趋势,在学术界和工业界都有更长足的进步。”
未来,双方将携手朝着塑造云计算时代开源软件发展新生态、探索用软件定义赋予云计算基础设施灵活性能力的产学研究,以及开发迭代云原生数据编排服务系统等方向共同前行。
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。