Pensando是一家由前思科高管创立的初创公司,今天该公司走出隐形模式,获得了2亿多美元的资金,并推出了一款定制芯片,该芯片承诺将为企业的本地服务器提供强大动力。
早在业界甚至都还不知道它是做什么的之前,Pensando就已经备受关注,部分原因来自于该公司的领导层,包括了首席执行官和思科前高级副总裁Prem Jain,以及来自思科的其他三名资深人士:Mario Mazzola、Luca Cafiero和Soni Jiandani。他们之前创立的初创公司被思科以8.63亿美元的价格收购。
Pensando设计的是一种数据中心芯片,专门用于优化对网络管理、安全和数据存储相关计算任务的处理。Pensando把这种芯片作为加速器卡的一个组成部分,加速卡可以插入服务器,并从主处理器上分担这些任务。据Pensando称,这样可以让CPU的利用率降低20%到40%。
释放出周期有助于大大提高效率。数据中心服务器可以利用这些额外的计算力去处理更多的工作负载。此外,Pensando的硬件接管了网络、安全和存储管理方面的繁重工作,从而不再需要企业以前所使用的昂贵设备。
Pensando围绕自己的芯片技术构建了一套完整的产品,包括两款加速卡即Naples 100和Naples 25,以及一款名为Venice的系统,该系统可使管理员集中管理部署。
目前已经有多家财富500强企业的数据中心采用了Pensando的硬件,其中高盛集团(Goldman Sachs Group Inc.)既是Pensando的客户也是投资方。Pensando在两轮融资中获得了1.33亿美元的资金,目前正在进行第三轮融资的规模预计最高可达到1.45亿美元,使得Pensando的估值高达6.45亿美元。
Pensando并不是唯一一家希望利用定制芯片来撼动数据中心市场并且资金雄厚的初创公司。总部位于美国加州圣克拉拉的Fungible公司最近凭借自己的数据处理器技术获得了2亿美元资金,这种处理器可以分担服务器CPU的处理器密集型网络任务。Fungible的领导层与Pensando团队有着相似的背景:首席执行官Pradeep Sindhu曾是瞻博公司的原始创始人之一。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。