扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
中国在高性能计算领域所取得的成就已为世界所瞩目,但如果中国的超级计算机不再使用美国制造的64位处理器和GPU协处理器,而是将自家生产的低功耗、基于MIPS架构的龙芯取代美制x86芯片,结果又会如何呢?
在上周举行的国际固态电路会议上,龙芯首席设计师胡伟武介绍了龙芯的最新发展计划。龙芯是中国科学院计算所自主研发的通用CPU。
中国于2002年开始投资50亿美元研发龙芯处理器。在本届大会上,中国科学院展示了下一代8核心龙芯-3B芯片。预示着中国未来的超级计算机将用自主研制的龙芯代替美国设计的x86芯片和GPU协同处理器。
中国展开的一系列侧重于具体技术领域的大型项目对中国技术独立和未来经济发展至关重要,包括处理器制造、操作系统、芯片工艺技术、4G无线网络、核裂变工厂、水体污染控制和治理、飞行器设计与制造、高分辨率卫星摄像、载人航天和月球探索。
龙芯基于SGI公司的MIPS架构。32位的龙芯-1主频只有266MH。龙芯-2为64位,主频提高至1.2 GHz。2007年发布的龙芯-2F具有4个核心,主频800MHz,浮点运算能力32亿次/秒。针对服务器应用的龙芯-3A处理器在推迟一年后发布。中科院在开发时加入了对硬件的64位指令仿真功能,El Reg一年前就曾报道称,龙芯-3处理器加入了一些指令,可以帮助QEMU管理程序(Red Hat KVM管理程序的核心部分)实现x86和MIPS指令格式的转换。
中科院龙芯系列处理器路线图
龙芯-3A在设计上采用65nm CMOS工艺和BGA封装格式,4个64位处理器核心,主频为900MHz至1GHz,浮点运算能力160亿次/秒。该处理器包含4.25亿个晶体管,核心面积174.5平方毫米,功耗仅10W,还包括两个16位的HyperTransport 1.0 端口、4MB二级缓存和两个支持DDR2和DDR3的内存控制器。
胡伟武在ISSCC大会上介绍的龙芯-3B采用65nm CMOS 工艺,具有8个核心,每个核心有2个256位向量协同处理器,主频仍为1GHz,浮点运算能力1.28千亿次/秒。该处理器具有两个HyperTransport端口和两个DDR3内存控制器,共包含5.83亿个晶体管,核心面积为299.8平方毫米,功耗为40W。在之前的测试中龙芯-3B功耗为28.9W,内核以外的部分消耗11.1W。
胡伟武表示:“MIPS基本指令只有300多条,我们自己增加了500多条。在龙芯-3B和龙芯-2H处理器中,我们的向量计算部件实现了128个256位的寄存器。”
龙芯-3B处理器示意图
龙芯-3B将会在2012年用于曙光6000超级计算机。下图为配备了龙芯-3B处理器刀片的早期版本。
曙光双路龙芯-3A和龙芯-3B刀片服务器
曙光6000刀片服务器
胡伟武透露,曙光6000刀片的设计曾经用于深圳国家超级计算中心研制至强5650和英伟达M2050的混合系统——星云。星云在2010年11月的TOP500中以1.271千万亿次/秒的成绩获得第三名。
另一个曙光6000刀片集群将配备3000个龙芯-3B芯片,计算水平将达到300万亿次/秒。预计会在今年夏天推出。
曙光6000刀片系统绝不是中科院计算所能达到的最高密度。我们可以查看下胡伟武在ISSCC大会上展示的1U机架服务器的系统板:
中科院IU2T 系统板
这个1U 2T的系统板集成了16个8核心的龙芯-3B处理器,计算水平为2万亿次/秒,一个机架就能得到42万亿次/秒的计算水平。因此要达到1千万亿次/秒的计算水平,理论上24个机架就可以实现。
龙芯-3C的设计将采用28nm制程工艺,推出8核与16核两种产品,具有更高的主频,介于1.5GHz至2GHz之间,计算水平将能够达到5.12千亿次/秒。从路线图可以得知,该处理器还有能力扩展到16核以上,预计会在2012年底或2012年初推出。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者