7月20日,寒武纪正式登陆科创板,市值超过千亿元。寒武纪在业界可谓大名鼎鼎,自出生起,寒武纪就是一家明星公司。寒武纪天使轮融资时就估值5亿元,此后3年时间完成了5轮融资,总金额46亿元。
寒武纪备受关注除了国人对国产芯片的期待之外,另一大原因是其主打的“AI芯片”正是当下的风口。今天,市场上,智能手机、智能云计算、智慧+……不绝于耳,恨不得什么东西都得带上“智能”、“智慧”两个字,而支撑“智能”、“智慧”的背后就是各种人工智能芯片。
实际上,人工智能成为了当下芯片产业的一大动力。此前在英特尔面前只能称小弟的英伟达因为AI行业的火爆,带动了GPU热销而一飞冲天,如今市值超过了行业老大英特尔。
深感压力的英特尔在GPU上失了先手如今正在紧紧追赶,加紧研发独立GPU,同时,英特尔还在不断优化CPU和改进以提升CPU在AI场景的适用性,比如在指令集中加入AI专用指令。其最新推出的第三代服务器芯片至强中最大亮点之一就是体现在AI方面,作为首款具有内置bfloat16(BF16)支持的主流服务器处理器,至强能进一步增强其深度学习优化能力。
AI市场火爆的行情还推动了专用AI芯片的研发,这也是寒武纪背后关注的一大原因。在国际市场上,谷歌近期对外透露了最新一代TPU芯片(第四代TPU)的一些信息。该芯片用于运行人工智能工作负载,性能是上一代的2倍多。此前的TPU第三代和第二代产品通过谷歌Google Cloud Platform向企业提供这两代芯片,其性能水平令人印象深刻。
不仅是谷歌,其他AI芯片公司也是如此。7 月中旬,Graphcore 正式发布第二代 IPU 以及用于大规模系统级产品 IPU-Machine: M2000(IPU-M2000)。新产品比第一代 Graphcore IPU 性能提升 8 倍。Graphcore的IPU也是一种专门为AI场景定制的通用处理器,其内核采用了大规模并行MIMD,内置一个300MB的分布式片上SRAM,使得其相比CPU+DDR2或者GPU+GDDR/HBM能够实现10到320倍的性能提升。
芯片公司在AI方面的投入与AI市场的火爆一脉相承。近几年,得益于AI三要素(算力、算法、数据)的改进和提高,AI市场进入了高速发展阶段。数据预测,到2025年全球智能终端数量将会达到400亿台,智能助理的普及率将达到 90%,企业数据的使用率将达到 86%。这些都是芯片公司重金头AI市场的底气。不难预料,未来相当长时间内AI芯片的热度也将持续,市场上将会出现更多性能更加强劲的芯片,将为AI市场的爆发积蓄力量,也为AI重塑我们的工作和生活奠定基础。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。