12月26日,由京能集团主办的“浮点时代·京能智算”北京人工智能公共算力平台(上庄)发布仪式在京顺利举办。北京市海淀区委书记张革,北京市经信局党组书记、局长姜广智,市国资委一级巡视员翟贤军,海淀区委副书记杨仁全,市科委委员二级巡视员刘航,中关村科学城管委会专职副主任何建吾;京能集团党委书记、董事长姜帆,党委副书记、总经理阚兴,副总经理隋晓峰;中科曙光总裁历军,中科曙光高级副总裁任京暘等相关领导出席并见证平台发布。北京市政府主管部门领导、行业专家及企业代表70余人参加。
北京人工智能公共算力平台(上庄)由京能集团承建和运营。作为北京市属国有骨干企业,京能集团现已形成电力、热力、煤炭、健康文旅等多业态产业格局,成为首都能源重要保障力量。
曙光公司总裁历军参加启动仪式
京能集团党委书记、董事长姜帆表示,北京人工智能公共算力平台(上庄)的上线,是京能集团实现“能源+算力”融合发展、战略转型的起点,是北京市打造数字标杆城市新基建底座的成功实践。京能集团通过汇聚中科曙光等国内外顶尖的技术力量,致力于将算力平台打造成为技术领先、功能完善、服务一流的人工智能基础设施,为首都数字经济发展提供强大的算力支持。
中科曙光依托自身算力技术及产业优势,是智能计算建设的先行者,业务覆盖了从硬件到软件、从建设模式到算力服务、从先进理念到应用实践。曙光5A级智算中心、浸没式相变液冷技术、全国一体化算力服务平台等,亦成为智算中心2.0时代的先锋实践。本次合作,公司作为项目算力建设方,按照“算能融合”的理念与模式,将5A智算中心与能源企业的电厂基础设施及余热制冷等特色节能技术相结合,在最短时间内建设具有“开放、融合、绿色、普惠、服务”特征的算力平台,助力北京市人工智能创新成果顺利落地,同时也为国内能源行业企业实现“能源+算力”协同发展提供了样板示范。
会上,京能集团与中科曙光签署协议,达成战略合作伙伴关系。双方将充分发挥各自优势,共同探索“能源+数字”产业高质量发展的必经之路。同时,双方还以北京人工智能公共算力平台(上庄)建设为基石,共同推动人工智能技术的研发和应用,为北京乃至全国打造人工智能创新策源新高地。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。