2018年3月5日上午,十三届全国人大一次会议在人民大会堂开幕,国务院总理李克强在政府工作报告中再提“人工智能”。
报告提出:实施大数据发展行动,加强新一代人工智能研发应用,在医疗、养老、教育、文化、体育等多领域推进“互联网+”。发展智能产业,拓展智能生活。运用新技术、新业态、新模式,大力改造提升传统产业。
这是继2017年后,“人工智能”再次被写入政府工作报告。
2018年初,国家发改委公布了《2018年“互联网+”、人工智能创新发展和数字经济试点重大工程支持项目名单》,曙光信息产业股份有限公司联合中国科学院计算技术研究所、北京市商汤科技开发有限公司、云宏信息科技股份有限公司、成都索贝数码科技股份有限公司申报的“面向深度学习应用的开源平台建设及应用”项目成功入选,成为全国仅有的两家获国家支持的深度学习应用开源平台建设者之一。
此次面向深度学习应用的开源平台重大项目,标志着我国在国家级AI开源平台建设中迈出了重要的一步,平台的建设将集中整合优势企业的产业领先资源,突破我国人工智能产业发展瓶颈,夯实产业发展基础,带动国产算法、软件、应用协同发展,助推人工智能行业应用,提升国产技术产品和服务的竞争力。能够成功入围也彰显了曙光在AI领域强大的技术研发实力和生态整合能力。通过该平台的建设和推广,曙光公司也将更好地发挥人工智能时代的赋能者角色。
作为人工智能创新发展的核心技术研发平台之一,面向深度学习应用的开源平台是建设人工智能生态的关键环节之一,“开源”明确了其开放属性,“平台”则强调其通用属性,其重要性可形象地比喻为人工智能领域的“安卓系统”。
目前我国人工智能领域软件生态面临很大挑战,深度学习开发难度大、开发环境不完善,且资源标准不统一,异构资源复杂,这些都为软件开发设置了较高的门槛,提升了开发成本,严重制约了开发的速度和丰富程度。而市场被国外相关产品和技术框架占据,国内产业生态的发展阻力重重,不打破这种局面,我国人工智能发展难以实现突破,通过人工智能实现“换道超车”也有沦为空想之虞。
基于在人工智能及深度学习领域百余项专利等核心前沿技术,依托覆盖深度学习指令集、核心算法库、软件栈、计算框架以及应用开发的全技术链强大的科研能力,以及开源深度学习框架和开源大数据软件等软件开源基础,曙光将全面构建面向深度学习应用的开源平台。该平台将支持CPU、GPU、FPGA等多类型异构硬件,提供完整的开发协议栈,配套开发工具,有效降低开发难度。这就像是给人工智能的开发者提供了一个“安卓系统”,统一的开源平台可以促进上下游产业链对接,开发难度的降低可望促使应用创新进一步繁荣,这将进一步促进国产算法、软件、应用的协同发展,提升国产技术产品和服务的竞争力,对构建人工智能国产生态链,提升信息安全保障,具有重要的现实意义和推动作用。
作为联合申报单位中唯一的科研院所,中科院计算技术研究所将充分发挥高性能计算机研究中心的在深度学习相关高性能算法设计及优化的优势,调动计算所旗下寒武纪人工智能芯片的亮点资源,在软、硬两大核心能力上为平台提供核心技术支持。
人工智能的发展离不开应用场景的支撑,并且跟大规模设备资源、支撑算法库、训练库等平台级资源密不可分,在这方面,国内的平台资源严重不足,也大大制约了人工智能应用的开发和产业发展。曙光无可比拟的计算资源优势以及超大规模平台运营管理能力,遍布全国的网络服务资源为开源平台的建设和应用提供了强有力的保障。
通过建设和整合超过40家城市云服务中心,10余家先进计算中心以及地球数值模拟装置等城市大脑和科学大脑资源,曙光将构建一个庞大的人工智能开放计算公共平台,以及一个统一的服务门户,提供运营服务的同时,辅以算法训练及模型配置等强大的计算服务,和超过100PB的跨媒体、多模态数据服务,最大程度地满足开发者资源需求的问题。同时,通过加强与各科研院所和应用厂商的合作,开展不少于10类以上的人工智能应用验证,涵盖图像处理、语音处理、自然语言理解等典型的人工智能应用领域。
作为国内深度学习第一厂商,商汤科技目前已拥有国内最大的深度学习集群,通过自主研发建立了国内顶级的深度学习超算中心。凭借在高性能异构基础算法库、深度学习大规模训练系统等方面的先动优势,商汤科技将在联合项目中承担算法训练库建设和跨媒体数据关联的重任。
有了强大的技术保障、资源优势和运营能力,曙光计划在建设周期内帮助地方政府、各类企业、科研院校等孵化超过100个项目,旨在让全国各地区各领域的开发者和用户,能像在公共云计算平台一样,方便地开发AI应用、取用AI服务。
人工智能开放计算服务平台的建设,将为各类人工智能应用提供创新沃土,创新应用籍此得到孵化和应用,这对于加强我国人工智能产业渗透能力,促进人工智能与实体经济深度融合,推动我国区域产业升级和各行各业的创新发展具有标杆性意义。
曙光公司副总裁沙超群表示,自2017年 “数据中国智能计划”发布以来,曙光的人工智能业务捷报频传,增长迅猛。此次在诸多竞争对手中胜出,作为人工智能的国家队承建国家级面向深度学习应用的开源平台,对曙光AI而言将是又一契机。曙光将加快探索出一条独特的产学研一体化发展道路,为建立更完善的产业生态不断努力,更好为产业和经济发展赋能。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。