随着人工智能的快速发展,层出不穷的AI应用对于算力有了更多要求,于是我们看到各种人工智能芯片不断涌现。
谈到人工智能芯片,我们一定会想到GPU、FPGA、ASIC等芯片,但是你知道数据流AI芯片吗?
随着摩尔定律的放缓,传统的指令集架构面临着内存墙问题,芯片有效算力的发挥受到制衡,人工智能算法的快速发展又对算力支撑提出了更高的需求,市场亟需高性能、低延时、高算力性价比的商用AI芯片。
鲲云科技基于其在定制数据流领域三十余年的技术积累,提出新的AI计算平台的架构实现方式——“定制数据流架构”CAISA,并于2020年6月发布全球首款可商用数据流AI芯片CAISA。

CAISA定制数据流架构为鲲云自主研发的源头性技术,是为深度学习神经网络定制的高性能AI计算架构。基于CAISA芯片的技术优势,鲲云科技提供高性能、低延时、高算力性价比的人工智能计算加速解决方案。

在近日举行的人工智能计算大会AICC 2021上,鲲云科技合伙人、首席运营官王少军博士接受记者采访时表示,不同于传统的冯·诺依曼的指令集架构,CAISA架构通过数据流流动次序来控制计算顺序,消除指令操作导致的额外时间开销,让CNN网络的算子级数据流图可以实现高效流水线运算。
同时CAISA可并行执行数据访问和数据计算,进一步减少计算单元的空闲时间,最大化地利用芯片的计算资源,从而为客户提供更高的实测算力,算力性价比领先市场。
CAISA芯片通过控制数据的流动次序来管理计算执行次序,能大大提升芯片的利用效率,最高可实现95.4%的芯片利用率,较同类产品提升11.6倍,打破了算力提升对芯片制程工艺的高度依赖。
CAISA芯片聚焦人工智能领域,注重发挥数据流架构的算力性价比优势。目前,CAISA架构可支持多种深度学习算法,包括目标检测、分割、分类等领域的主流算法,实现了在深度学习领域的通用性。
王少军说,鲲云科技始终贴近落地需求,CAISA芯片面向云和边缘侧的场景,比如智慧城市(园区)、工业质检等垂直领域,满足不同场景的人工智能计算需求。

目前搭载CAISA芯片的星空X3加速卡、星空X6A边缘小站、星空X9加速卡等在智能制造、智慧能源、数据中心等实现规模落地。
”鲲云科技与产业生态进行了积极合作,例如2019年与浪潮达成战略合作,2020年完成产品适配,推出搭载星空X9加速卡的智算中心AI服务器。“王少军说。
除了硬件级创新,鲲云科技提供RainBuilder开发工具链,能够实现自顶层深度学习开源框架算法至底层架构时钟的精确映射,兼容现有AI开发框架、生态及软件,在软件的易用性方面进一步降低了应用门槛。
谈及未来AI算力的发展,王少军表示,人工智能的发展要求算力均衡,更加注重性价比,同时软硬件的协同也是未来算力的发展重点。鲲云科技也将持续创新,为AI芯片研发和产业发展探索新的道路。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。