随着人工智能的快速发展,层出不穷的AI应用对于算力有了更多要求,于是我们看到各种人工智能芯片不断涌现。
谈到人工智能芯片,我们一定会想到GPU、FPGA、ASIC等芯片,但是你知道数据流AI芯片吗?
随着摩尔定律的放缓,传统的指令集架构面临着内存墙问题,芯片有效算力的发挥受到制衡,人工智能算法的快速发展又对算力支撑提出了更高的需求,市场亟需高性能、低延时、高算力性价比的商用AI芯片。
鲲云科技基于其在定制数据流领域三十余年的技术积累,提出新的AI计算平台的架构实现方式——“定制数据流架构”CAISA,并于2020年6月发布全球首款可商用数据流AI芯片CAISA。

CAISA定制数据流架构为鲲云自主研发的源头性技术,是为深度学习神经网络定制的高性能AI计算架构。基于CAISA芯片的技术优势,鲲云科技提供高性能、低延时、高算力性价比的人工智能计算加速解决方案。

在近日举行的人工智能计算大会AICC 2021上,鲲云科技合伙人、首席运营官王少军博士接受记者采访时表示,不同于传统的冯·诺依曼的指令集架构,CAISA架构通过数据流流动次序来控制计算顺序,消除指令操作导致的额外时间开销,让CNN网络的算子级数据流图可以实现高效流水线运算。
同时CAISA可并行执行数据访问和数据计算,进一步减少计算单元的空闲时间,最大化地利用芯片的计算资源,从而为客户提供更高的实测算力,算力性价比领先市场。
CAISA芯片通过控制数据的流动次序来管理计算执行次序,能大大提升芯片的利用效率,最高可实现95.4%的芯片利用率,较同类产品提升11.6倍,打破了算力提升对芯片制程工艺的高度依赖。
CAISA芯片聚焦人工智能领域,注重发挥数据流架构的算力性价比优势。目前,CAISA架构可支持多种深度学习算法,包括目标检测、分割、分类等领域的主流算法,实现了在深度学习领域的通用性。
王少军说,鲲云科技始终贴近落地需求,CAISA芯片面向云和边缘侧的场景,比如智慧城市(园区)、工业质检等垂直领域,满足不同场景的人工智能计算需求。

目前搭载CAISA芯片的星空X3加速卡、星空X6A边缘小站、星空X9加速卡等在智能制造、智慧能源、数据中心等实现规模落地。
”鲲云科技与产业生态进行了积极合作,例如2019年与浪潮达成战略合作,2020年完成产品适配,推出搭载星空X9加速卡的智算中心AI服务器。“王少军说。
除了硬件级创新,鲲云科技提供RainBuilder开发工具链,能够实现自顶层深度学习开源框架算法至底层架构时钟的精确映射,兼容现有AI开发框架、生态及软件,在软件的易用性方面进一步降低了应用门槛。
谈及未来AI算力的发展,王少军表示,人工智能的发展要求算力均衡,更加注重性价比,同时软硬件的协同也是未来算力的发展重点。鲲云科技也将持续创新,为AI芯片研发和产业发展探索新的道路。
好文章,需要你的鼓励
滑铁卢大学研究团队开发出LOCKET技术,解决AI服务"按需付费"的商业化难题。该技术通过创新的"适配器融合"方式替代易泄露的密码验证,实现100%有效拒绝未授权功能,同时保持已授权功能性能损失不超过7%。面对恶意攻击的成功率控制在5%以下,为AI服务提供商提供了可行的精细化定价解决方案。
谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
KAIST研究团队开发出Diffusion-Link技术,通过扩散模型解决AI系统中音频与文字信息的"沟通障碍"。该技术采用轻量级设计,无需外部知识即可将音频特征转换为文字特征,在音频字幕生成任务上取得突破性成果,零样本性能提升52.5%,为多模态AI系统发展开辟新路径。