近期AI计算平台已经迎来新一轮升级。从NVIDIA发布Rubin GPU,到Intel发布至强6,再到AMD的锐龙和EPYC处理器,无一不在强调AI加速的重要性。特别是在PC领域,Windows on ARM产品蓄势待发,基于x86的AI PC更是锁定先进制程,将AI TOPS和应用范围都拓宽到更广大产品线中。
AI时代的到来,势必所有的AI PC、数据中心、边缘计算、终端应用所搭载的存储器容量都呈现出倍数增长模式,DRAM、NAND Flash需求量大增,甚至推动新一轮的技术变革,HBM、CXL技术都是很好的例子。更重要的是,以闪存为介质的存储,在其中已经开始扮演更重要的角色。
让数据中心性能倍增
近期大热的NVIDIA DGX B200将AI性能提升到全新层次,实时大型语言模型推理和人工智能训练性能呈现出指数级增长,从而可以更好的应对包括大语言模型、推荐系统、聊天机器人在内的AI应用,成为AI转型的关键。
这意味着DGX B200需要处理各种复杂的工作负载,除了使用高规格的NVLink互联技术和Blackwell GPU之外,同样还需要高性能存储方案应对企业数据密集型工作负载时所需的敏捷性和可扩展性。

这是一套复杂的存储系统,需要在PCIe® 5.0与NVMe规范下实现可靠的RAID兼容性和互操作性能。特别是生成式AI与检索增强生成 (RAG) 系统的重要性更胜以往,关系数据库PostgreSQL和向量数据库需求变得格外重要。
为此,铠侠与Xinnor展开合作,在COMPUTEX 2024上宣布旗下的PCIe® 5.0 NVMe SSD成功通过Xinnor的RAID解决方案的兼容性和互操作性测试,与采用相同硬件配置的软件 RAID 解决方案相比,在数据降级模式下执行PostgreSQL,效能更提升达25倍。
不仅如此,铠侠PCIe® 5.0 SSD拥有出色的性能。具备了对PCIe® 5.0和NVMe™ 2.0的支持,并已经充足释放PCIe® 5.0性能的产品,最大容量同样也达到了30.72TB。

提升终端AI体验
无论是基于ARM还是基于x86的AI PC,为AI算力加速已经成为主要竞争力。离线模型在AI PC上运行可以很好的保护用户的隐私需求,同时在网络受限的环境下,依靠AI PC的性能也可以获得文生图、图生图、信息整理等流畅的本地AI体验。
AI PC带来的存储需求的提升,已经在产品中有所体现。单个离线模型已经动辄数十GB,容量已经堪比3A游戏大作。如果需要在不同应用之间切换,那么上百GB的存储空间也变成了必需。因此我们仔细观察今年发布的AI PC产品,在标配32GB内存的同时,1TB存储空间成为了基本盘。而在未来,Lunar Lake也将对存储提出更进一步的要求。

基于骁龙X Elite的笔记本亦是如此,Windows on ARM的进一步推广,同样也需要PCIe SSD的支持,未来一段时间中,我们也会看到采用1TB以上的PCIe 4.0 SSD与骁龙X系列处理器搭配,从而更好的发挥AI性能。
AI PC最大的特点之一是注重轻薄化,不仅要求SSD有足够的性能,也必须占用更小的空间。铠侠 BG6 系列固态硬盘在赋能助力AI PC方面展现了卓越的性能和灵活性。采用 PCIe® 4.0 和NVMe 1.4c规范,搭载高达2,048 GB的KIOXIA BiCS FLASH™第6代TLC闪存,其中最小尺寸只有M.2 2230,即使平板型笔记本也不在话下。在未来,第8代KIOXIA BiCS FLASH™ QLC闪存也将蓄势待发,为移动设备存储容量和性能提供了更多可能性。

手机和XR设备的移动端同样也需要AI的加持,在未来离线模型也将会成为智能设备的一部分,作为UFS 4.0的重要推动者之一,铠侠已经将这项技术应用于产品中,尤其是在各大厂商新近发布的旗舰级手机和平板电脑上,凭借着高性能和小尺寸,铠侠UFS4.0的小尺寸封装为手机、移动设备等终端产品提供了更大的空间优势,也进一步给AI设备的个性化设计提供了更多可能。

随着AI算力不断升级,我们将会看到更多的产品优先选用大容量存储的产品,铠侠也将继续致力于闪存解决方案的研发和创新,以成为全球用户信赖的存储产品解决方案供应商之一。铠侠不仅存储数据,并将通过利用数据来创造价值。在多样化数字社会进程中,助力创建行业标准,应对不断变化的市场趋势,推动行业向令人振奋的方向发展。
好文章,需要你的鼓励
TPU与GPU之间的竞争正在重塑AI硬件市场格局。GPU基于并行处理,能处理多样化任务,而TPU专门针对张量矩阵运算进行优化。谷歌TPU采用类似RISC的设计理念,通过限制功能来提升特定运算效率。随着Meta计划在2027年采购数十亿美元的TPU芯片,Anthropic宣布使用百万TPU训练Claude模型,TPU生态系统正在获得发展动力,对英伟达的GPU霸主地位构成挑战。
Meta与华盛顿大学联合研究团队开发出无需人类标注的AI评判官自我训练框架。该方法通过生成合成对比数据、自我判断筛选和反复学习,使110亿参数的AI评判官在多项视觉语言任务中超越GPT-4o等大型模型,成本仅为传统方法的1%,为AI自主学习和评估开辟新路径。
本文提出2026年AI发展十大预测,包括AI估值修正、投资泡沫持续、AGI不仅依赖大语言模型、AI代理将加剧工作替代等。作者强调社会接受度对技术发展的重要性,认为成功企业将重构运营模式以AI为核心,同时指出政府仍将重视STEM教育而忽视社会科学的价值。
华中科技大学团队开发出4DLangVGGT技术,首次实现AI系统对4D动态场景的语言理解。该技术突破传统方法需要逐场景训练的限制,能跨场景通用部署。系统结合几何感知和语义理解,不仅能识别物体还能描述其时间变化过程。实验显示在多项指标上超越现有方法1-2%,为机器人、AR/VR、智能监控等领域提供重要技术支撑。