大语言模型和生成式AI引发人工智能的新潮流,AI应用无处不在,特别是AI手机和AI PC正逐渐成为行业的热点,也成为芯片巨头之间的新战场。
当前,移动设备上出现越来越多包括生成式AI在内的智能技术。同时,市场对更高性能、更加智能以及更多视觉和触觉交互的需求仍在持续飙升,带来了比以往更大、更加复杂的计算需求。近期,关于下一代Arm Cortex-X内核的信息被披露。据悉,这款产品代号是Blackhawk(黑鹰),目标是将高端智能手机的解决方案扩展到真正的PC级性能。
AI时代需要全新的芯片
不管是AI手机还是AI PC都是人们日常接触的设备,如何将AI功能融入到这些设备中,那应用场景是具有巨大的想象空间的。然而,现有的移动处理器在性能上仍需要不断提升才能应对日新月异的AI应用,特别是在需要高性能计算的场景下,如复杂的数据处理和AI算法的运行等。随着AI应用的复杂度增加,能耗也随之增加。为了确保移动设备的电池寿命,处理器芯片需要具有更高的能效比,即在保证高性能的同时降低能耗。因此,AI手机和AI PC对处理器芯片的要求不仅仅是单一的性能提升,而是需要在多个维度上进行综合考虑和优化,以支持日益复杂的AI应用需求。
值得期待的下一代Arm Cortex-X
去年,Arm推出了Arm 2023全面计算解决方案(TCS23),致力于为智能手机推出性能最优异的移动计算平台。在TCS23中,作为第四代X内核,Arm Cortex-X4与上一代的Cortex-X3相比,性能提高15%,基于相同工艺的全新高能效微架构可降低40%功耗,面积仅增加10%。同时它也具备更高的可伸缩性,最高可以支持每个核2MB的2级缓存。
按照已有的产品迭代节奏,Cortex-X5即将发布。根据年初来自国外研究公司Moor Insights and Strategy关于Arm下一代Cortex-X核的报告中指出,Arm CEO Rene Haas在内部严格要求团队“消除Arm设计的处理器与定制Arm处理器之间的性能差距”,并预计在Geekbench和AI性能以及IPC等方面实现巨大提升。
据悉,为落实这项战略,Arm内部团队以交付2024年最高性能的内核为任务,组建了一个内部跨职能项目,该项目汇集了全公司最优秀的工程师,运行多年,并与主要芯片厂商密切合作。该工程团队从设计的方方面面探究提升性能的方式,特别是针对3nm及更先进的工艺,目的是让高端智能手机的解决方案可扩展到真正的PC级性能。通过该项目交付的新内核预计将不仅具备Armv9的最新功能,并拥有业界最宽的uArch,可以带来领先的IPC表现,增强AI性能,同时保持优异的能效。
从目前得到的这些消息,Cortex-X5应该承载了Arm的非常多的心血,毕竟Cortex-X4在去年推出时被描述为“有史以来最快的Arm CPU”,Cortex-X5究竟能够带来多大的提升非常值得期待。不过可以预计的是Arm下一代Cortex-X产品——Cortex-X5的到来,标志着Arm的又一次重大突破,使得Arm的处理器解决方案更加完善,必将为市场带来强大的动力,意味着消费者能够享受到更加出色的移动计算体验,也将进一步巩固Arm在移动处理器市场的领导地位。
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。