ZD至顶网服务器频道 08月18日 新闻消息:2015年8月18日,由龙芯中科技术有限公司举办的“龙芯2015新品发布暨合作伙伴大会”在北京朗丽姿西山花园酒店隆重举行。出席本次会议的领导、嘉宾包括中国工程院副院长陈左宁院士,中国工程院倪光南院士、李国杰院士,中央网信办、工信部等相关领导以及两百余家自主可控产业链合作单位代表、知名媒体,总计逾八百余人。多家重量级国产IT厂商合作伙伴发布了基于龙芯CPU的整机产品,国产自主可控IT产业生态初现。
发布“芯”产品,站上新起点
本次发布会的最重要的看点就是龙芯新一代处理器架构产品的发布,包括龙芯正式推出了龙芯自主指令系统“LoongISA”,龙芯新一代高性能处理器微结构“GS464E”,新一代处理器“龙芯3A2000”“龙芯3B2000”以及龙芯基础软硬件标准及社区版操作系统“LOONGNIX”。“龙芯”作为国产CPU的代表,其最大特色是体现在了产品的自主研发,而龙芯这次发布的下一代处理器架构,则将国产CPU的自主研发水平跃升到了一个新的台阶。
据龙芯总设计师胡伟武在大会上介绍,中科院计算所从2001年起开始龙芯CPU的研发,得到了包括863、973、自然科学基金、知识创新工程、“核髙基”重大专项等国家项目的支持。2010年起,在北京市牵头投资的支持下,龙芯团队转型成立公司,把在计算所研制的CPU样品进行产品化形成了龙芯的第一代CPU产品,通过与应用充分磨合发现已有产品的问题,并在此基础上进行新一代的产品研发。本次发布会发布的是龙芯公司的第二代处理器产品,也是第一代结合市场需求自主定义并研发的产品。
本次发布的龙芯指令系统LoongISA,在MIPS64架构500多条指令的基础上,在基础指令、虚拟机指令、面向X86和ARM的二进制翻译指令、向量指令四个方面增加了近1400条新指令。本次发布的新一代高性能处理器微结构GS464E,综合技术水平达到了与Intel的IvyBridgy及AMD的Steamroller相当的水平。本次发布的龙芯3A2000/3B2000多核CPU芯片,实现了LoongISA指令系统,片内集成了四个GS464E处理器核,综合性能比龙芯的上一代产品大幅度提高。本次发布的LOONGNIX社区版操作系统,通过充分的软硬件适配优化大幅度提升了整机的性能及稳定性,可以有效支撑自主操作系统及整机企业基于龙芯CPU研制自主软硬件产品。
龙芯处理器的这次发布,完全以企业形象示人,以客户需求为中心,意味着龙芯在IT自主化的道路上已经完成从“研发”到“市场”的转型。据胡伟武介绍,经过2010年以来5年的创业期,龙芯中科公司已经到了高速发展期,并逐步摆脱对政府项目的依赖,通过市场赢利来支撑CPU产品研发,国内著名投资机构鼎晖资本已经入资龙芯中科公司。
打造“芯”生态,发力产业链
本次发布会活动得到了龙芯上下游合作伙伴的鼎力支持。在这次大会上,龙芯除了发布新一代处理器产品外,龙芯生态圈内的数百家合作伙伴在服务器、桌面计算机、网络安全及工控等众多领域的技术产品与创新成果进行了集中展示,国产自主可控产业链的各个重量级合作伙伴也全部出席,中科曙光、航天科工、同方计算机、浪潮超越、东软集团、锐捷网络、研华中国等一线品牌厂商的高层领导在大会上相继发布了基于龙芯3A/3B/2H系列处理器的高性能服务器、安全计算机、笔记本、加固平板、高性能防火墙、千兆网络交换机、高性能工控模块等一系列优秀的产品解决方案,国产自主可控产业链初现。这一系列基于国产龙芯的自主可控重量级产品的发布,对于推进“自主可控”国家战略具有重要意义。
据胡伟武总裁介绍,龙芯近年来除了不断提高产品本身的研发能力之外,同时花了更大的精力在软硬件生态的建设与完善上,目前龙芯的研发团队虽然只有400人,但基于龙芯CPU进行下游解决方案开发的合作伙伴已经有数百家,合作企业中基于龙芯CPU的研发人员已经达到上万人规模。经过多年的市场培育,围绕龙芯CPU的国产自主可控生态圈俨然已经悄然成形。
“自主可控、安全可靠”已经成为新时期中国信息产业发展的重要国家战略,贯穿到信息安全和信息产业发展的各个方面。龙芯经过十几年的研发积累和市场探索,在自主CPU领域获得了客户的认可和肯定。龙芯正在以更加坚定的步伐从学院派向市场派转型,以客户为中心,以市场为导向,与合作伙伴一起,共同为我国自主可控、安全可靠的信息化建设贡献力量。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。