近期AI计算平台已经迎来新一轮升级。从NVIDIA发布Rubin GPU,到Intel发布至强6,再到AMD的锐龙和EPYC处理器,无一不在强调AI加速的重要性。特别是在PC领域,Windows on ARM产品蓄势待发,基于x86的AI PC更是锁定先进制程,将AI TOPS和应用范围都拓宽到更广大产品线中。
AI时代的到来,势必所有的AI PC、数据中心、边缘计算、终端应用所搭载的存储器容量都呈现出倍数增长模式,DRAM、NAND Flash需求量大增,甚至推动新一轮的技术变革,HBM、CXL技术都是很好的例子。更重要的是,以闪存为介质的存储,在其中已经开始扮演更重要的角色。
让数据中心性能倍增
近期大热的NVIDIA DGX B200将AI性能提升到全新层次,实时大型语言模型推理和人工智能训练性能呈现出指数级增长,从而可以更好的应对包括大语言模型、推荐系统、聊天机器人在内的AI应用,成为AI转型的关键。
这意味着DGX B200需要处理各种复杂的工作负载,除了使用高规格的NVLink互联技术和Blackwell GPU之外,同样还需要高性能存储方案应对企业数据密集型工作负载时所需的敏捷性和可扩展性。
这是一套复杂的存储系统,需要在PCIe® 5.0与NVMe规范下实现可靠的RAID兼容性和互操作性能。特别是生成式AI与检索增强生成 (RAG) 系统的重要性更胜以往,关系数据库PostgreSQL和向量数据库需求变得格外重要。
为此,铠侠与Xinnor展开合作,在COMPUTEX 2024上宣布旗下的PCIe® 5.0 NVMe SSD成功通过Xinnor的RAID解决方案的兼容性和互操作性测试,与采用相同硬件配置的软件 RAID 解决方案相比,在数据降级模式下执行PostgreSQL,效能更提升达25倍。
不仅如此,铠侠PCIe® 5.0 SSD拥有出色的性能。具备了对PCIe® 5.0和NVMe™ 2.0的支持,并已经充足释放PCIe® 5.0性能的产品,最大容量同样也达到了30.72TB。
提升终端AI体验
无论是基于ARM还是基于x86的AI PC,为AI算力加速已经成为主要竞争力。离线模型在AI PC上运行可以很好的保护用户的隐私需求,同时在网络受限的环境下,依靠AI PC的性能也可以获得文生图、图生图、信息整理等流畅的本地AI体验。
AI PC带来的存储需求的提升,已经在产品中有所体现。单个离线模型已经动辄数十GB,容量已经堪比3A游戏大作。如果需要在不同应用之间切换,那么上百GB的存储空间也变成了必需。因此我们仔细观察今年发布的AI PC产品,在标配32GB内存的同时,1TB存储空间成为了基本盘。而在未来,Lunar Lake也将对存储提出更进一步的要求。
基于骁龙X Elite的笔记本亦是如此,Windows on ARM的进一步推广,同样也需要PCIe SSD的支持,未来一段时间中,我们也会看到采用1TB以上的PCIe 4.0 SSD与骁龙X系列处理器搭配,从而更好的发挥AI性能。
AI PC最大的特点之一是注重轻薄化,不仅要求SSD有足够的性能,也必须占用更小的空间。铠侠 BG6 系列固态硬盘在赋能助力AI PC方面展现了卓越的性能和灵活性。采用 PCIe® 4.0 和NVMe 1.4c规范,搭载高达2,048 GB的KIOXIA BiCS FLASH™第6代TLC闪存,其中最小尺寸只有M.2 2230,即使平板型笔记本也不在话下。在未来,第8代KIOXIA BiCS FLASH™ QLC闪存也将蓄势待发,为移动设备存储容量和性能提供了更多可能性。
手机和XR设备的移动端同样也需要AI的加持,在未来离线模型也将会成为智能设备的一部分,作为UFS 4.0的重要推动者之一,铠侠已经将这项技术应用于产品中,尤其是在各大厂商新近发布的旗舰级手机和平板电脑上,凭借着高性能和小尺寸,铠侠UFS4.0的小尺寸封装为手机、移动设备等终端产品提供了更大的空间优势,也进一步给AI设备的个性化设计提供了更多可能。
随着AI算力不断升级,我们将会看到更多的产品优先选用大容量存储的产品,铠侠也将继续致力于闪存解决方案的研发和创新,以成为全球用户信赖的存储产品解决方案供应商之一。铠侠不仅存储数据,并将通过利用数据来创造价值。在多样化数字社会进程中,助力创建行业标准,应对不断变化的市场趋势,推动行业向令人振奋的方向发展。
好文章,需要你的鼓励
OpenAI发布了音视频生成模型Sora 2,同时推出配套社交应用Sora,用户可生成包含自己的视频并在类似TikTok的信息流中分享。Sora 2在物理定律遵循方面有显著改进,视频更加真实。应用提供"客串"功能,允许用户将自己植入生成场景中,并可与朋友分享形象使用权限。该iOS应用目前在美加地区采用邀请制,ChatGPT Pro用户可直接体验。
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
大语言模型和生成式AI自诞生以来问题频发,从推理模型表现不佳到AI幻觉现象,再到版权诉讼,这些都表明当前技术路径可能并非通往真正智能的正确道路。专家认为,仅靠增加数据和算力的扩展模式已显现边际效应递减,无法实现通用人工智能。研究者提出智能应包含统计、结构、推理和目标四个层次的协调,并强调时间因果性的重要性。面对LLM技术局限,业界开始探索神经符号AI等替代方案。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。