3月18日-21日,全球规模最大的 GPU 开发者大会——英伟达GPU技术大会(GTC 2019)在美国硅谷举行。在这一全球人工智能技术交流及软硬件产品展示的舞台上,中国先进计算技术产业领导者中科曙光首次在海外展示了其XMachine系列GPU服务器家族的两款重磅产品——训练服务器X795-G30及推理服务器W760-G30。
X795-G30面向深度学习训练用户,采用全新处理器架构给系统带来了性能上的飙升,可支持8颗基于英伟达最新NVLink2.0互联的Tesla V100 GPU,轻松获得最高达300GB/s的GPU内部互联带宽。高带宽、低延迟的GPU互联将为训练提供更高的加速比,成倍提升AI开发效率。
W760-G30推理服务器基于通用服务器开发,具备通用服务器的高扩展, 高性价比特性。针对英伟达NVIDIA T4 GPU的特殊需求,专门为英伟达NVIDIA T4 GPU全新设计了强力散热系统, 使GPU在通常使用的温度控制在70度以下, 并支持最多达6块英伟达NVIDIA T4 GPU。作为第三代专业线上异构服务解决方案,W760-G30专门设计用于AI推理服务,多媒体视频流转码,以及vGPU加速的虚拟化业务。
近年来人工智能技术迅速成熟、产品井喷,落地场景多种多样,可以预见相关智能应用将在未来数年内持续保持高速发展态势。这一方面意味着对服务器计算力提出更加强劲的需求,同时也对服务器性能提出新的挑战。
“支持8颗NVLink GPU的 X795-G30,是曙光目前单机性能最强的训练服务器,是搭建深度学习训练集群的最佳选择。同时,曙光也不断调研挖掘深度学习应用场景,结合自身技术特点推出一系列适用于不同智能业务的服务器。”中科曙光视觉与智能产品总监宋迪说,曙光将根据不同用户的诉求,通过一系列GPU服务器,为AI市场提供整套解决方案,满足市场需求。
宋迪还表示,面向中小微企业,曙光还在云端部署了大量的GPU服务器,帮助小企业把他们的应用简单地、快速地部署到云端去,面向市场提供云端的智能计算服务。
同时,曙光作为国内高性能的领导者和创新者,对高性能计算与人工智能融合发展的趋势也尽收眼底“在大数据、大模型、多任务的环境下,我们更需要高性能计算的强大能力支持人工智能的发展。”
“中科曙光+英伟达=深度学习解决方案。” 宋迪介绍说,中科曙光和英伟达合作由来已久,双方各自有着突出的特点和优势。英伟达是顶尖的人工智能芯片企业之一,
曙光则在高性能计算及高端服务器产品上应用GPU加速计算的研究非常的深入和广泛。在技术产品匹配方面,曙光研发多样化的产品全线支持英伟达系列GPU产品,双方优势互补,共同致力于用更高水平的人工智能技术和产品赋能用户。
近年来,中科曙光作为新一代信息基础设施的建设者,不断结合自身技术优势和市场需求深化产品和服务能力,为用户提供智能计算支撑。此次在GTC2019亮相的新款GPU服务器作为曙光智能硬件设施的代表,与曙光此前部署的人工智能管理平台SothisAI相得益彰,搭起了曙光面向AI赋能的整体框架。此外,曙光还是全国仅有的两家获国家支持的深度学习应用开源平台建设者之一,不断通过整合多方资源共同研发部署,推动AI在智慧城市、智能制造和数据密集型科学研究等领域的深入应用。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。