英特尔AI CTO：人工智能训练需要新型芯片架构

英特尔人工智能产品集团新上任的首席技术官Amir Khosrowshahi表示，当你使用GPU水平较低的时候，业界需要新架构用于神经网络的理由就愈加明显了。

Khosrowshahi此前是Nervana System公司的共同创始人兼首席技术官，该公司在去年8月被英特尔收购，金额未对外公布。Nervana的技术迅速成为英特尔人工智能计划的核心。

Khosrowshahi详细介绍了Nervana公司是如何使用GPU的，因为“这是最先进的技术”，Nervana用它自己的汇编器取代了标准的Nvidia汇编器，因为这被Nervana视为可以生成“次优”指令。

“我们在公司发展初期是这么做的，部分是为了我们自己的发展，但后来我们意识到它比Nvidia的库要快2-3倍，所以我们将其作为开源发布了。”

Nervana的努力并没有止步于软件方面，它还创造了自己的硅芯片瞄准神经网络训练。

“神经网络是一系列预定的操作，它不像是用户与系统的交互，它是一组可以被描述为数据流图表的指令。”

据Khosrowshahi称，一些功能有助于图形处理单元执行图形渲染工作——如大量缓存，处理节点，渲染——都是多余的。

“GPU中有很多电路，这对于机器学习来说并不是必需的，随着时间推移有很多东西堆积起来。”

“你并不需要电路，这些电路在芯片中占很大比例，而且能源利用成本也很高。”

“神经网络非常简单，它是很少的矩阵乘法和非线性，你可以直接搭建硅芯片来实现。你可以搭建硅芯片专用于神经网络架构，GPU却不是这样的。”

Khosrowshahi给出的答案是正在开发的Lake Crest，英特尔将在今年向选定客户推出这个独立的加速器，随着时间的推移，它还将更紧密地与至强处理器捆绑在一起。

“这是一个张量处理器，处理矩阵操作的指令。”Khosrowshahi解释说。“所以指令集是矩阵1乘以矩阵2，通过一个查找表，而且这些大指令都是高级别的。”

“在GPU中，它是一个个的寄存器，移入另一个寄存器，做逐个元素的乘法，这是相当低级别的。”

不过Khosrowshahi表示，Nvidia近年来努力让他们的GPU更适合于神经网络，他们的人工智能芯片仍然具有大量图形功能。

“作为一家芯片厂商，我可以看出为什么这对Nvidia来说很困难，”Khosrowshahi说。

另一方面，英特尔通过收购一步步接近人工智能。

“推出一个全新的价格，这在芯片行业是一大挑战；英特尔的方式就是收购。他们收购了FPGA，所以又收购了Altera，Altera是一个非常酷的架构，专注于神经网络，所以FPGA架构对于神经网络来说是非常有趣的……当然，Nervana芯片很大程度上也是一个专注于引擎的神经网络，但是稍微脱离出神经网络一些。”

当谈到神经网络时，Khosrowshahi认为考虑在硅芯片中做蚀刻神经网络是错误的，因为其中很多功能仍然是在软件方面的。

“很多功能都是在软件的，所以即使开发了Lake Crest，针对Lake Crest的指令也不是‘神经网络，这么做’，而是这个矩阵乘以这个矩阵。”

“除了芯片之外，还有一些软件知道这是神经网络，这是训练，用户寻找不同的东西并搜索参数——当你有了神经网络系统的时候这些都是你要做的事情。”

在神经科学的大背景下，Khosrowshahi认为人工智能的重点不是重建人脑，而是超越人脑。

“人脑就是人工智能的一个例子，但这是相当有限的人工智能，我的视觉系统看到了物理世界，它知道去了解世界的统计数据。”

“如果你环顾四周，你能看到很多边缘、很多表面、阴影区等等，如果你看看大脑……主要是视觉皮层，有对这些特征敏感的神经元，所以你的人工智能了解这个世界的统计数据，并且能够对此进行推论——就像是这个杯子快要打碎，我接住了这个杯子。”

但是企业内的数据与人类互动的数据大不相同，Khosrowshahi说。

“这个统计数据是非常不直观的，所以让人工智能处理这些数据是另外一种智能了。”

“这试图向人们解释这一点，因为他们认为我们正在创造一个大脑，我们想做的超越了这一点，我们希望创造一种新的人工智能，可以理解企业、医疗等所有领域的数据统计，这些数据本质上与现实世界中的截然不同。

英特尔人工智能架构的竞争对手之一是Google定制的Tensor Processing Unit，本周Google称这种架构笔当前的GPU和CPU快15-30倍，功效高30-80倍。

本周，IBM和Nvidia也宣布IBM将从5月开始在IBM Cloud中提供Tesla的P100。

来源：ZD至顶网服务器频道

0赞

好文章，需要你的鼓励

英特尔AI CTO：人工智能训练需要新型芯片架构

来源：ZD至顶网服务器频道

2017

04/07

15:28

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

谷歌Gemini大模型登陆甲骨文云平台

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: