3月26日-29日,全球瞩目的人工智能(AI)领域盛会——第九届年度GPU技术大会(GTC2018)在美国硅谷召开。中科曙光作为GTC重要赞助商之一应邀亮相本次大会,除了展示最先进的技术发展动向和软硬件一体化平台,中科曙光还将与数千名与会嘉宾寻求以计算为核心的人工智能生态交流和合作。
在人工智能发展浪潮中,中科曙光依托先进计算的技术和服务扮演着AI赋能者的角色。中科曙光创立伊始,凭借国家政策支持及强大的研发能力,不断积累技术创新实力和增强产品研发能力。在牵头承担和参与多项国家重大研发和产业化项目的过程中,逐步建立起赋能AI计算的能力基础。在国家发改委发布的《2018年“互联网+”、人工智能创新发展、数字经济试点重大工程拟支持项目名单》中,中科曙光“面向深度学习应用的开源平台建设及应用项目”成功入围,是仅有的两个人工智能开源平台项目之一。
源于深厚的积累,当人工智能应用需求呈现出越来越多元化的特点时,中科曙光成功推出一体化软硬件解决方案,推动AI功能在各应用领域的实现,进一步服务全球行业客户。
在降低用户切入深度学习领域的经济和技术成本方面,曙光推出的容器化的集群调度及深度学习云服务方案——“SothisAI”具有简单易用、弹性灵活、可快速部署等特点,可协助用户快速获得AI所需的计算力,目前SothisAI平台已在多所高校、研究中心及超算中心部署使用;在应用场景覆盖方面,中科曙光推出了一套完备的深度学习服务器XMachine,支持包括GPU、 FPGA在内的多种主流深度学习加速器件,并兼容SXM2和PCI-E两种不同的接口模式。
XMachine系列服务器现已被广泛应用于智能医疗、智慧城市、语音识别、图像识别、自然语言处理等领域。对于NVIDIA在此次大会最新发布的V100 32G版本,XMachine系列深度学习服务器业已完美兼容。
作为支撑人工智能技术的幕后中坚,中科曙光率先以全局眼光谋求AI生态整合。早在2015年,中科曙光就联合中科院计算技术研究所、NVIDIA三方成立了联合实验室,这也为之后三者在人工智能领域的深入合作奠定了基础。正是基于联合实验室相关工作的逐步深入,曙光在构建人工智能产业生态方面不遗余力。
在推出SothisAI平台的基础上,中科曙光发布“SothisAI开放实验室计划”,面向全球募集AI算法、应用和服务开发者,开放中科曙光分布在全国的40多个城市云平台,以及包括地球数值模拟装置在内的若干大科学装置和先进计算中心,联合产业链上下游企业进行协同研发和服务部署,进而促进AI在智慧城市、智能制造和数据密集型科学研究领域的深入应用。
为进一步构建完善的智能计算的生态环境,中科曙光还在2017年智能峰会上发起成立了“数据中国‘智’囊团”,首批成员单位包括寒武纪、商汤科技、南瑞集团、中科三清、UCloud、徐州市公安局等在内的共计15家单位。李斌博士介绍“数据中国‘智’囊团”时表示,该团体希望联合芯片、算法、数据、应用等AI相关领域的机构,进行关键共性技术和关键行业应用的协同研发,共同推动中国人工智能生态环境的快速健康发展。
李斌博士进一步透露,基于中科曙光-ICT-NVIDIA联合实验室平台和相关博士后流动站支持的深度学习研发团队,中科曙光将在深度学习未来的发展过程中融合高性能计算和云平台等多方面技术优势,打造面向更广泛用户群体的产品应用体系,开拓人工智能的应用领域,构建良好的人工智能生态环境,助力人工智能技术在各行各业开花结果、落地成实。
大会介绍:GTC2018 大会由NVIDIA举办。本次大会的主题是“人工智能与深度学习”,8000余名全球顶尖研究人员、商业领袖、技术开发者等齐聚硅谷,共同探讨自动驾驶汽车、高性能计算、机器人、医疗保健、智慧城市、数据中心和云计算、安防、生命科学、计算机和机器视觉、虚拟现实等领域的未来技术发展。
好文章,需要你的鼓励
这项研究针对现代文档检索系统中的关键缺陷:独立处理文档片段导致丢失上下文信息。研究团队开发了ConTEB基准测试来评估模型利用文档级上下文的能力,并提出了InSeNT方法,结合后期分块和创新的对比学习策略。实验表明,上下文感知嵌入显著提升检索性能,尤其在处理非自包含文本片段时,同时保持计算效率,对分块策略更具鲁棒性,并且在语料库规模扩大时表现更佳。这一研究为更智能的文档检索系统铺平了道路。
这项由布朗大学和Cohere实验室研究者联合进行的研究全面分析了大型语言模型(LLM)安全研究中的语言不平等现象。通过系统回顾近300篇2020-2024年间的安全相关论文,研究发现LLM安全研究严重偏向英语,即使中文这样的高资源语言也仅获得英语十分之一的研究关注,且这一差距正在扩大。研究还揭示非英语语言很少作为独立研究对象,且英语安全研究常忽略语言覆盖文档化。为解决这一问题,研究者提出了三个未来方向:开发文化敏感的评估基准、创建多语言安全训练数据,以及深入理解跨语言安全泛化挑战。
这项研究提出了ChARM,一种创新的角色扮演AI奖励建模框架,通过行为自适应边界和自我进化策略大幅提升AI角色的真实性和一致性。研究团队创建了包含1,108个角色的RoleplayPref数据集,实验表明ChARM比传统模型提高了13%的偏好排名准确率,应用于DPO技术后在多项基准测试中达到了领先水平。这一突破将为娱乐、教育和心理健康支持等领域带来更加自然、个性化的AI互动体验。
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。