随着人工智能的快速发展,层出不穷的AI应用对于算力有了更多要求,于是我们看到各种人工智能芯片不断涌现。
谈到人工智能芯片,我们一定会想到GPU、FPGA、ASIC等芯片,但是你知道数据流AI芯片吗?
随着摩尔定律的放缓,传统的指令集架构面临着内存墙问题,芯片有效算力的发挥受到制衡,人工智能算法的快速发展又对算力支撑提出了更高的需求,市场亟需高性能、低延时、高算力性价比的商用AI芯片。
鲲云科技基于其在定制数据流领域三十余年的技术积累,提出新的AI计算平台的架构实现方式——“定制数据流架构”CAISA,并于2020年6月发布全球首款可商用数据流AI芯片CAISA。

CAISA定制数据流架构为鲲云自主研发的源头性技术,是为深度学习神经网络定制的高性能AI计算架构。基于CAISA芯片的技术优势,鲲云科技提供高性能、低延时、高算力性价比的人工智能计算加速解决方案。

在近日举行的人工智能计算大会AICC 2021上,鲲云科技合伙人、首席运营官王少军博士接受记者采访时表示,不同于传统的冯·诺依曼的指令集架构,CAISA架构通过数据流流动次序来控制计算顺序,消除指令操作导致的额外时间开销,让CNN网络的算子级数据流图可以实现高效流水线运算。
同时CAISA可并行执行数据访问和数据计算,进一步减少计算单元的空闲时间,最大化地利用芯片的计算资源,从而为客户提供更高的实测算力,算力性价比领先市场。
CAISA芯片通过控制数据的流动次序来管理计算执行次序,能大大提升芯片的利用效率,最高可实现95.4%的芯片利用率,较同类产品提升11.6倍,打破了算力提升对芯片制程工艺的高度依赖。
CAISA芯片聚焦人工智能领域,注重发挥数据流架构的算力性价比优势。目前,CAISA架构可支持多种深度学习算法,包括目标检测、分割、分类等领域的主流算法,实现了在深度学习领域的通用性。
王少军说,鲲云科技始终贴近落地需求,CAISA芯片面向云和边缘侧的场景,比如智慧城市(园区)、工业质检等垂直领域,满足不同场景的人工智能计算需求。

目前搭载CAISA芯片的星空X3加速卡、星空X6A边缘小站、星空X9加速卡等在智能制造、智慧能源、数据中心等实现规模落地。
”鲲云科技与产业生态进行了积极合作,例如2019年与浪潮达成战略合作,2020年完成产品适配,推出搭载星空X9加速卡的智算中心AI服务器。“王少军说。
除了硬件级创新,鲲云科技提供RainBuilder开发工具链,能够实现自顶层深度学习开源框架算法至底层架构时钟的精确映射,兼容现有AI开发框架、生态及软件,在软件的易用性方面进一步降低了应用门槛。
谈及未来AI算力的发展,王少军表示,人工智能的发展要求算力均衡,更加注重性价比,同时软硬件的协同也是未来算力的发展重点。鲲云科技也将持续创新,为AI芯片研发和产业发展探索新的道路。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。