近两年前,当整个世界意识到生成式AI改变游戏规则的能力以及使其成为可能的强大芯片时,半导体行业再次引发了人们新的兴趣。其中,最大受益者是Nvidia,但同时各种初创公司都在寻求挑战这家AI芯片巨头或者是寻找其他可以颠覆的领域。
虽然半导体初创公司面临的风险仍然很高——成本通常比早期软件公司高得多——但今年该行业可能增长高达20%的预期可以让他们从中受益,之所以有如此高的预期,一部分原因是市场对AI芯片有着强劲的需求。
这为Cerebras Systems、Hailo和Kneron等AI芯片初创公司制造了很大的空间,他们可以从IDC在12月预测的预计支出增长中分一杯羹,其他希望颠覆AI计算芯片设计方式的半导体初创公司还包括Celestial AI、Eliyan、Rivos和Tenstorrent等等。
Celestial AI
高管:创始人、首席执行官David Lazovsky
Celestial AI表示,正在通过自己的Photonic Fabric光学互连技术克服延迟和带宽方面的瓶颈,为AI计算技术进步铺平道路。
这家总部位于美国加州圣克拉拉的初创公司在今年3月宣布,已经在C轮融资中获得1.75亿美金,而且这轮融资是“超额认购”的,由U.S. Innovative Technology Fund领投,AMD、三星、大众集团控股公司Porsche SE的风险投资部门参与。
同样是的3月,这家硅光子初创公司表示,超大规模企业(全球最大的数据中心基础设施消费者)和半导体公司“进入到技术采用的初期阶段,目前正在设计Photonic Fabric光学芯片”。据Celestial AI称,这种将光学芯片集成到多芯片封装中的做法,正在日益成为高性能处理器的常态,与“其他最先进技术”相比,封装外带宽可提高25倍。
Cerebras Systems
高管:联合创始人、首席执行官Andrew Feldman
Cerebras Systems正在利用自己的Wafer Scale Engine芯片挑战Nvidia在AI计算领域的主导地位,该公司表示,他们的芯片能够实现卓越的每瓦性能和“前所未有的可扩展性”。
今年3月,这家位于美国加利福尼亚州桑尼维尔的初创公司发布了第三代芯片Wafer Scale Engine 3,并表示,该芯片的性能是上一代芯片的“2倍”,而且“功耗和价格相同”。WSE-3由4万亿个晶体管组成,采用台积电的5纳米工艺,包含了90万个AI核心和44 GB片上SRAM,能够实现125 petaflops的16位浮点性能。
Cerebras Systems今年的其他里程碑事件包括与医疗巨头梅奥诊所进行多年期的战略合作,开发多模态大型语言模型以改善患者治疗结果和诊断,与AI初创公司Aleph Alpha进行了多年期合作,构建安全的自主AI解决方案,以及为总部位于阿布扎比的科技控股集团G42打造Condor Galaxy 3超级计算机。
Eliyan
高管:联合创始人、首席执行官Ramin Farjadrad
Eliyan希望通过自己的NuLink PHY互连技术打破芯片间带宽障碍,帮助芯片设计师构建更强大的、基于芯片的处理器。
这家总部位于美国加州圣克拉拉的初创公司在今年3月宣布完成了一轮6000万美金的融资,由Samsung Catalyst和Tiger Global Management共同领投,并得到英特尔和SK Hynix风险投资部门等其他投资方支持。
今年早些时候,Eliyan公司表示,推出了物理层上“性能最高”的解决方案,用于在单芯片架构中连接多个芯片,并且使用台积电的3纳米制造工艺,每条链路可实现高达64 Gbps的速度。
Hailo
高管:联合创始人、首席执行官Orr Danon
Hailo正在与Nvidia展开竞争,利用在优化成本和功耗性能方面处于领先地位的芯片来加速边缘的生成式AI工作负载。
这家总部位于以色列特拉维夫的初创公司今年4月宣布,作为C轮融资的延伸,已经从投资方那里获得了1.2亿美金,而且推出了新的Hailo-10加速器,可以为PC和汽车信息娱乐系统等设备实现“以最小功耗实现最高的生成式AI性能”。
例如,Hailo-10能够以每秒最多10个token的速度运行有70亿参数的Llama 2模型,功率仅为5瓦。对于Stable Diffusion 2.1模型,该芯片在相同功率下5秒即可创建图像。
Kneron
高管:Albert Liu,创始人、首席执行官
Kneron推出的AI芯片旨在为企业降低服务器成本,以及在生成式AI方面降低PC价格,来削弱Nvidia的影响力。
这家总部位于美国加利福尼亚州圣地亚哥的初创公司在今年6月宣布推出了第二代“边缘GPT”服务器KNEO 330,并表示,该服务器可以将小型企业的AI成本降低30-40%,能够实现每秒48万亿次运算(TOPS)和最多8个并发连接,支持大型语言模型和与云解决方案相当的检索增强生成精度。
Kneron已经从高通和富士康等投资方那里融资了1.9亿美金,还发布了第三代神经处理单元(NPU) KL830,旨在实现低成本AI PC以及支持AI的物联网应用。
MetisX
高管:Jin Kim,联合创始人、首席执行官
MetisX旨在通过开发基于Compute Express Link (CXL)技术的智能内存系统,使数据中心“更智能、更快速、更具成本效益”。
这家总部位于韩国首尔的初创公司在今年5月宣布,已经在A轮融资中获得了4400万美金,并表示计划在美国扩展业务,明年推出一款针对超大规模客户的芯片。
MetisX公司表示,已经完成了大规模数据处理用例的原型,例如矢量数据库、大数据分析和DNA分析,并且此类原型的性能比传统服务器CPU提高一倍。
Rivos
高管:联合创始人、首席执行官Puneet Kumar
Rivos希望通过结合高性能RISC-V CPU和用于数据分析和生成式AI工作负载的数据并行加速器芯片来撼动数据中心市场。
这家总部位于美国加州圣克拉拉的初创公司是由前谷歌、苹果和英特尔工程师创立的,该公司在今年4月宣布,已经从包括英特尔和戴尔风险投资部门在内的多家投资方那里筹集了超过2.5亿美元的A-3轮超额认购资金。
Rivos公司在今年2月与苹果公司达成诉讼和解之后,宣布获得了这笔资金,并表示将用于推出首款芯片产品并扩大团队规模。苹果公司曾指责Rivos从苹果挖走了数十名工程师,窃取了商业机密,而Rivos则以不正当竞争为由对其提起了反诉。
SiMa.ai
高管:创始人、首席执行官Krishna Rangasayee
SiMa.ai希望在运行生成式AI工作负载方面通过强大而高效的芯片取代Nvidia,这些芯片可以在一个“以软件为中心”的平台上处理多种模式。
这家总部位于美国加州圣何塞的初创公司在今年4月宣布,已经从投资方那里筹集了7000万美金,其中包括戴尔风险投资部门和Cadence Design Systems执行董事长Lip-Bu Tan。
SiMa.ai公司表示,将利用这笔资金继续满足客户对其第一代机器学习片上系统(MLSoC)的需求,这种芯片专门用于计算机视觉;同时加快第二代MLSoC的开发,该芯片支持多模式生成式AI工作负载,包括语音、音频、文本和图像。
Tenstorrent
高管:首席执行官Jim Keller
Tenstorrent致力于通过一种将销售专用处理器与授权芯片技术供他人使用相结合的商业模式,在AI计算芯片设计领域开辟出一条新的道路。
这家总部位于安大略省多伦多的初创公司在今年2月宣布,已经和日本前沿半导体技术中心达成“多层次合作协议”,后者计划利用Tenstorrent的RISC-V和小芯片技术开发他们的2纳米边缘AI加速器,Tenstorrent将作为这种芯片的联合设计合作伙伴。
据The Information在6月的报道,Tenstorrent公司去年在由现代汽车集团和Samsung Catalyst Fund领投的融资中获得了1亿美金,在Samsung领投的新一轮融资中获得了至少3亿美金,总估值达到20亿美金。据报道,另一家韩国大公司LG电子也就此轮融资进行了谈判。
Taalas
高管:创始人、首席执行官Ljubisa Bajic
Taalas试图通过设计可直接实现整个AI模型的加速器芯片来颠覆Nvidia的通用GPU战略,据称这可以将成本降低多达1000倍。
这家总部位于安大略省多伦多的初创公司是由Tenstorrent创始人Llubisa Bajic牵头的,该公司在今年3月宣布融资5000万美金,并透露了计划创建一个自动化工作流程,将所有类型的深度学习模型硬连线到芯片中。
Taalas表示,得益于这种设计方法,他们能够设计一个包含整个大型AI模型的芯片“而无需外部存储器”,因此这种芯片设计预计比小型GPU数据中心芯片性能更高,为把AI计算成本降低1000多倍开辟了道路。
Taalas表示,计划在今年第三季度推出首款大型语言模型芯片,并于明年第一季度向客户出货。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。