当地时间10月26日,联合国秘书长安东尼奥·古特雷斯在纽约总部宣布,正式成立联合国高级别人工智能咨询机构(High Level Advisory Body on AI),对于这项技术带来的风险和机遇进行探讨,并为国际社会加强治理提供支持。
联合国高级别人工智能咨询机构成员分布在33个不同国家,包含20名女性与19名男性。其中,我国的代表分别是中国科学院自动化研究所研究员曾毅与中国政法大学数据法治研究院教授张凌寒。

曾毅是中国科学院自动化研究所类脑认知智能实验室负责人和人工智能伦理与治理研究中心主任、研究员。同时也是远期人工智能中心(Center for Long-term AI)的创始主任,并领导面向可持续发展的人工智能协作网络(AI for SDGs Cooperation Network)以及国防人工智能与军备控制网络(Defense AI and Arms Control Network)。他还是联合国教科文组织(UNESCO)人工智能伦理特设专家组和世界卫生组织(WHO)健康领域人工智能伦理/治理专家组的专家,也担任中国人工智能学会心智计算专业委员会主任,也是中国国家新一代人工智能治理专业委员会和国家科技伦理委员会人工智能分委会的委员。
他的研究领域围绕类脑智能研究展开,主要包括类脑认知计算模型与人工智能伦理与治理。类脑认知计算模型方面,具体包括类脑脉冲神经网络、类脑人工神经网络、类脑自主学习理论与算法,研究成果应用于类脑信息处理、类脑智能机器人的研究中;人工智能伦理与治理方面,包括研究不同人工智能模型存在的风险、安全、伦理问题,并通过算法落地的形式研究低风险、高度安全、具有道德与伦理的有益人工智能模型。

张凌寒博士是中国政法大学数据法治研究院教授,博士生导师,康奈尔大学访问学者。她在网络空间法和算法治理领域发表了大量研究成果,曾主持国家社会科学基金项目,研究算法监管和人工智能治理。她是《在线虚拟财产侵权责任研究》和《统治力量:人工智能时代的算法监管》的作者,还翻译过《美国和亚洲女性主义法律:跨太平洋对话》等书籍,以及多本法律教材的合编者,同时也是中国法学会网络与信息法研究会理事会成员、家庭法研究会理事会成员。她还担任中国工业和信息化部信息与通信科学技术委员会和中国信息安全法律委员会的专家委员。她多年来一直参与研究和立法工作。
她的主要研究方向为民商法、网络与数据法。在《法商研究》《法律科学》《法制与社会发展》等核心期刊发表论文三十余篇,其中多篇被《人大报刊复印资料》《中国社会科学文摘》《高等学校文科学术文摘》全文转载,并被北大法律信息网统计为2018-2021年高被引作者。她还主持国家社科基金、教育部、司法部、中国法学会、博士后基金等人文社科项目,参编参译多部专著、教材。
成立联合国高级别人工智能咨询机构的计划,最初在今年6月由古特雷斯宣布,当时希望能建立一个类似国际原子能机构(IAEA)的国际人工智能监督机构,定期审查人工智能治理安排,并就如何使其与人权、法治和公共利益相一致提出建议。古特雷斯当时表示,这一模式可能会“非常有趣”,但他也指出:“只有会员国才能创建它,而不是联合国秘书处。”
联合国高级别人工智能咨询机构汇集了39名来自政府、私营部门、研究界、公民社会和学术界的专家,包含20名女性和19名男性,在政府、企业、技术界、民间社会和学术界拥有丰富的经验,具有全球性、性别均衡和跨学科等特点。
联合国高级别人工智能咨询机构的努力将以《联合国宪章》所包含的普遍价值观为基础,并具有包容性。截至今年年底,该机构将在三个领域提出初步建议:一是人工智能的国际治理;二是对风险和挑战的共同理解;三是利用人工智能加速实现可持续发展目标的关键机遇和推动因素。
古特雷斯强调,人工智能能够在多个领域为人类带来重大进展,包括危机预测和应对、公共卫生计划和教育服务等。人工智能的全面扩大和加强将有助于政府、民间社会和联合国的工作。尤其对于发展中经济体而言,人工智能提供了超越过时技术的机会,并直接服务于最需要帮助的人们。为了充分发挥人工智能对全人类的利益,并降低风险,他呼吁进行全球性、多学科、多利益相关方的对话,推动人工智能的发展和治理。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。