ISSCC:龙芯寄托中国高性能计算梦想

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

中国在高性能计算领域所取得的成就已为世界所瞩目，但如果中国的超级计算机不再使用美国制造的64位处理器和GPU协处理器，而是将自家生产的低功耗、基于MIPS架构的龙芯取代美制x86芯片，结果又会如何呢？

来源：ZDNet编译 2011年3月2日

在上周举行的国际固态电路会议上，龙芯首席设计师胡伟武介绍了龙芯的最新发展计划。龙芯是中国科学院计算所自主研发的通用CPU。

中国于2002年开始投资50亿美元研发龙芯处理器。在本届大会上，中国科学院展示了下一代8核心龙芯-3B芯片。预示着中国未来的超级计算机将用自主研制的龙芯代替美国设计的x86芯片和GPU协同处理器。

中国展开的一系列侧重于具体技术领域的大型项目对中国技术独立和未来经济发展至关重要，包括处理器制造、操作系统、芯片工艺技术、4G无线网络、核裂变工厂、水体污染控制和治理、飞行器设计与制造、高分辨率卫星摄像、载人航天和月球探索。

龙芯基于SGI公司的MIPS架构。32位的龙芯-1主频只有266MH。龙芯-2为64位，主频提高至1.2 GHz。2007年发布的龙芯-2F具有4个核心，主频800MHz，浮点运算能力32亿次/秒。针对服务器应用的龙芯-3A处理器在推迟一年后发布。中科院在开发时加入了对硬件的64位指令仿真功能，El Reg一年前就曾报道称，龙芯-3处理器加入了一些指令，可以帮助QEMU管理程序（Red Hat KVM管理程序的核心部分）实现x86和MIPS指令格式的转换。

中科院龙芯系列处理器路线图

龙芯-3A在设计上采用65nm CMOS工艺和BGA封装格式，4个64位处理器核心，主频为900MHz至1GHz，浮点运算能力160亿次/秒。该处理器包含4.25亿个晶体管，核心面积174.5平方毫米，功耗仅10W，还包括两个16位的HyperTransport 1.0 端口、4MB二级缓存和两个支持DDR2和DDR3的内存控制器。

胡伟武在ISSCC大会上介绍的龙芯-3B采用65nm CMOS 工艺，具有8个核心，每个核心有2个256位向量协同处理器，主频仍为1GHz，浮点运算能力1.28千亿次/秒。该处理器具有两个HyperTransport端口和两个DDR3内存控制器，共包含5.83亿个晶体管，核心面积为299.8平方毫米，功耗为40W。在之前的测试中龙芯-3B功耗为28.9W，内核以外的部分消耗11.1W。

胡伟武表示：“MIPS基本指令只有300多条，我们自己增加了500多条。在龙芯-3B和龙芯-2H处理器中，我们的向量计算部件实现了128个256位的寄存器。”