2019年1月8日,2018年度国家科学技术奖励大会在人民大会堂隆重召开,北京大学梅宏院士-黄罡教授团队与神州数码控股有限公司旗下北京因特睿软件有限公司(简称“因特睿”)合作完成的“云-端融合的资源反射机制及高效互操作技术”项目,获国家技术发明奖一等奖。北京大学梅宏院士、北京大学教授黄罡、因特睿总经理张颖等参加了颁奖大会。
这是神州控股坚持以数字中国为己任,以自主创新技术的产业化应用驱动发展,积极践行产学研深度融合、协同创新所取得的重大成果。
打破信息孤岛,实现其业务数据和功能与第三方系统的高效互操作,已成为实施大数据战略的重大需求,也是制约大数据价值链上下游的卡脖子技术。
传统互操作采用“白盒”技术思路,在全面了解信息孤岛内部实现细节的基础上进行二次开发,效率低、成本高、风险难控。该项目提出颠覆式技术途径——“黑盒”思路,揭示信息系统内部基于云-端融合特性的计算反射机理,发明了通过系统客户端外部监测与控制来实现业务数据和功能高效互操作的整套技术及平台,消除了系统源码、数据库表、后台权限、原开发团队等“白盒”依赖,信息孤岛开放效率平均提升2个数量级。
因特睿作为北京大学系统软件技术成果的转化与创新基地,将该技术成功转化为“燕云DaaS”系列产品,可在数据库封闭、源代码缺失、无原厂支持等情况下,智能生成给定系统的读写接口(API),构建数据和功能“管道”,实现数据的实时流动和功能的无缝集成,解决了制约互联网+政务发展的信息孤岛瓶颈问题,实现了系统的互联互通和数据的交互共享,平均可为用户节省超过90%以上的项目沟通协调时间,缩短50%的项目实施周期。燕云DaaS已经与神州控股等企业联合推出了20多种产品和解决方案。在国家政务信息系统整合共享、国家互联网+政务服务试点、国家安全和国防等重大工程和任务中广泛应用于科技部、工信部、农业农村部等10余个部委和北京、上海、贵州、浙江等20多个省市自治区,累计打破5000多个政务信息孤岛,成为支撑我国大数据产业生态发展的一项共性关键技术。创造了显著的经济社会效益,具有广泛的应用前景。
未来,因特睿将继续加大研发和应用力度,不断提升燕云系列产品的技术水平和应用能力,深入探索能源工业、医疗卫生、教育教学、金融科技等更多领域,为建立自主可控、物理分散、逻辑统一的大数据共享、融合、开放、创新体系提供关键基础平台支撑。
谈及此次荣膺国家级大奖,神州控股董事局主席兼首席执行官郭为表示,“神州控股自成立之初便以数字中国为使命,不断以自主创新技术的产业化应用驱动行业发展。除却依托自身技术团队的研发创新之外,神州控股通过与国内外知名高校、科研院所合作,围绕产业需求,开展大数据、云计算、人工智能等新一代技术攻关、项目孵化,在新形势下探索产学研协同创新模式,为技术创新提供源动力,打通科技成果转化‘最后一公里’。为了提升创新技术的产品化和产业化应用,神州控股投资了因特睿,并于2016年成立了‘北京大学—神州控股协同创新中心’,进一步围绕大数据创新技术及在多领域的创新应用进行探索,产学研结合,促进科技创新和科技成果转化。”
作为一家以“数字中国”为使命,致力于以前沿科技赋能行业数字化转型的科技企业,神州控股十分注重核心技术的研发和积累,坚持以创新驱动发展。在从整合IT服务商向大数据服务商升级的征途上,神州控股以资本和科技为驱动,依托大数据、人工智能的核心技术能力,在智慧城市、智慧供应链、智慧金融、智慧医疗、智慧农业、智能制造等行业的关键应用场景上实现了多项突破,成绩斐然。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。