2022年11月22日下午,以 “昇腾万里 · 智赋江苏”为主题的昇思生态城市行·南京站成功举办。
来自企业、高校、科研机构代表参会,现场活动气氛热烈。在全体与会嘉宾的见证下,南京大学、南京先进计算产业发展有限公司、华为三方举行了“金陵.女娲”大模型重磅签约仪式,共同孵化生命科学基础大模型,引领生命科学领域科研创新。
同时,江苏本地优秀企业代表云问科技&北联国芯、奥看科技分别发布了基于昇腾AI的知识管理与智慧城市解决方案。现场,共计21家企业及科研院所代表获颁昇思MindSpore技术认证证书,与昇思携手共建江苏人工智能产业新生态。昇腾AI创新大赛江苏赛区的颁奖仪式,也在活动中圆满完成。
重磅仪式
南京大学、南京先进计算产业发展有限公司(南京人工智能计算中心)、华为三方代表在活动现场进行了“金陵.女娲”大模型签约仪式。南京大学生命科学学院院长张辰宇、江苏省科学技术厅高新技术处副处长张迪、南京江北新区产业技术研创园党工委委员、南京集成电路培训基地有限公司董事长、北联国芯董事长周荣、华为江苏政企业务总经理付岩上台见证签约仪式。南京大学生命科学学院副教授周祯、科投集团党总支副书记、副总经理、先进计算总经理戴晓玉、华为昇思生态发展总监孙宾分别代表三家单位签约。
见签人、南京大学生命科学学院院长张辰宇表示,“金陵.女娲”大模型利用人工智能技术在DNA水平、碱基水平发现新的结构和相关特征,以期在这个层面上发现生命的规律,通过大数据、大模型使得生物医药产业能够受惠于人工智能的发展。
“金陵.女娲”大模型签约仪式
活动现场,南京云问网络技术有限公司政企事业部总监刘婉婷与江苏北联国芯技术有限公司技术创新中心总经理邓近陶分别代表云问科技与北联国芯联合发布知识管理解决方案一体机。南京奥看信息科技有限公司CEO 庞明与华为江苏产业发展与生态业务总经理陈军良共同发布了奥看科技基于昇腾AI的原生安全生产平台。
AI解决方案发布仪式
昇思MindSpore作为人工智能根技术,受到了产业界的高度重视,江苏已有相当数量的优秀企业使用昇思打造行业解决方案并获得昇思技术认证。现场,小视科技、云化科技、多伦科技等21家合作伙伴获颁昇思MindSpore技术方案认证证书。后续合作中,昇思将为认证伙伴提供更多技术能力和推广支持,赋能伙伴实现技术突破,打造核心解决方案,共建人工智能产业软硬件生态。
昇思MindSpore技术方案认证仪式
携手伙伴,以创新繁荣产业生态
昇思MindSpore致力于帮助伙伴和开发者高效使用AI能力,创新场景化AI应用,加速千行百业智能升级。东南大学副研究员杨武、无锡捷通数智科技有限公司副总经理鲁磊作为伙伴代表分别就昇思 AI 框架应用在电磁仿真计算、智慧城市建设等领域的实践与思考做了经验分享,为打造行业解决方案树立标杆。
南京先进计算产业发展有限公司副总经理孙祥详细介绍了江苏南京鲲鹏·昇腾人工智能计算中心的运营情况。他指出,计算中心将聚焦生命健康、政务、金融领域,重点推进相关要素的汇聚和应用,期待更多伙伴加入,共同繁荣昇腾AI生态。
江北新区研创园党工委委员、北联国芯董事长周荣、江苏省科协技术厅高新技术处副处长张迪、华为昇思首席科学家于璠为本次活动致辞。
会议结束后,昇思技术研讨会与鲲鹏·昇腾生态创新中心招商合作洽谈会也分别顺利举行,到场企业就技术问题与商业合作意愿与昇思技术专家、生态创新中心等进行了深度交流。
本次活动由江苏省科学技术厅指导,华为技术有限公司、南京江北新区产业技术研创园、南京江北新区科技投资集团共同主办,江苏鲲鹏·昇腾生态创新中心、南京集成电路培训基地承办。
昇思生态城市行活动从广州出发,重点覆盖上海、西安、长沙等国内人工智能重点发展区域。该活动基于昇腾人工智能计算中心,围绕昇思AI框架应用,发展昇腾AI生态展开,进而加速AI技术创新、行业应用落地和产业发展,推动千行百业智能化升级。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。