当英特尔、AMD和Nvidia还在相互拼杀的时候,已经涌现了很多家初创公司,要么向这些半导体巨头们发起了挑战,要么提供了替代性硬件可以改善系统的整体经济效益。
这些半导体初创公司并不局限于那些为深度学习等工作负载打造专有芯片的AI芯片初创公司,还有很多初创公司致力于解决与系统性能、吞吐量、效率、总拥有成本相关的各种问题。
根据《世界半导体贸易统计》预测,到2021年全球半导体行业的销售额将增长6.2%,因此,这些致力于通用CPU、高速互连和存储加速器的初创公司将会面对更多机遇。
Ampere Computing
首席执行官:Renee James
Ampere是由前英特尔高管Renee James创立的,致力于打造基于Arm的服务器CPU,特点是高性能、能效和总拥有成本。
这家位于美国加州圣克拉拉的初创公司今年推出了两款处理器:80核的Ampere Altra,称其为“用于现代云和边缘计算数据中心的第一款云原生CPU”,以及128核的Ampere Altra Max,提供“业界最多路级的性能和I/O可扩展性”。
最近,Ampere获得来自Oracle的4000万美元投资,宣布将启动基于80核Ampere Altra处理器的云实例。
Astera Labs
首席执行官:Jitendra Mohan
Astera Labs提供“系统感知的”集成电路、开发板和服务,以实现数据中心下一代PCIe连接。
这家位于美国加州圣克拉拉的初创公司在今年4月宣布,已经在B轮融资中获得了来自Intel Capital的资金。
Astera Labs将把这笔资金用于基于PCIe 4.0的Aries Smart Retimers批量生产,并开始为基于PCIe 5.0的Aries Smart Retimers生产样品,这两款产品都旨在在服务器系统中实现下一代PCIe连接。
Ayar Labs
首席执行官:Charlie Wuischpard
Ayar Labs在前英特尔高管Charlie Wuischpard的带领下,旨在通过使用高速、高密度、低功耗的光学互连小芯片替代传统的I/O组件,解决数据中心在吞吐量和功耗方面的瓶颈。
这家总部位于美国加州圣克拉拉的初创公司在今年11月宣布,已经在B轮融资中获得来自Globalfoundries和Intel Capital等多家风投公司的3500万美元资金。
Ayar Labs称,他们的技术使用光来迁移数据,而不是用电,这使得互连带宽密度减少了1000倍,功耗降低10倍。
EdgeQ
首席执行官:Vinay Ravuri
EdgeQ希望通过将5G连接和AI计算融合到一个片上系统,以实现下一代边缘计算和网络。
这家总部位于美国加州圣克拉拉的初创公司在今年11月刚刚走出隐身模式,获得了5100万美元投资,其中包括A轮融资的3850万美元。EdgeQ的团队中有很多半导体、5G、Wi-Fi和AI行业的资深人士,例如EdgeQ首席执行官、创始人高通前高管Vinay Ravuri。
EdgeQ表示,他们的片上系统具有开放的可编程性,可以为OEM厂商、运营商、现有的蜂窝协议及其他驱动器提供软件驱动的开发模型,EdgeQ的目标市场包括制造、建筑、能源和汽车等行业。
Fungible
首席执行官:Pradeep Sindhu
Fungible希望通过自己的Fungible数据处理单元为下一代数据中心提供动力。Fungible称,该技术可以消除虚拟化和存储等工作负载带来的高成本、低效率的问题。
这家位于美国加州圣何塞的初创公司在今年8月发布了Fungible DPU之后,推出了第一批以数据为中心的平台即Fungible Storage Cluster,该平台提供了高性能、安全的、可横向扩展的、可分解的数据存储平台。Fungible表示,该解决方案可以帮助整合工作负载,提高存储介质的利用率,减少空间占用,相比现有软件定义解决方案来说,每IOPS的成本至少减少3倍。
Fungible已经从投资者那里累计融资超过3亿美元,其中包括在由SoftBank Vision Fund领投的C轮融资中获得的2亿美元。
Kameleon Security
首席执行官:Jorge Myszne
Kameleon Security由来自英特尔、高通和微软的资深人士创立,现已开发出所谓首个 “主动型”安全处理单元,可以在系统全生命周期内实施安全措施。
这家位于美国加州山景城的初创公司在今年11月宣布,将与Xilinx合作发布Kameleon ProSPU——一种用于服务器、数据中心和云计算的网络保护芯片,Kameleon Security的安全处理单元将与Xilinx FPGA结合在一起。
此外,Kameleon Security还在设计Kameleon ProSPU,该产品将于2021年推出,符合Open Compute Project标准,而且Kameleon Security计划将开放该芯片的源代码。
Nuvia
首席执行官:Gerard Williams III
Nuvia的目标是通过重新定义数据中心的性能、能效、可扩展性、计算密度和总拥有成本来打造“世界领先的服务器处理器”。
这家总部位于美国加州圣克拉拉的初创公司在今年9月宣布,已经在B轮融资中获得来自Dell Technologies Capital和Marvell Technology Group创始人Sehat Sutardja和Weili Dai的2.4亿美元资金。
Nuvia由前苹果半导体业务高管Gerard Williams III、Manu Gulati和John Bruno创立。今年8月Nuvia表示,他们的目标是让自己的Phoenix CPU单线程工作负载性能比AMD Zen 2架构高出40%至50%。
Pensando
首席执行官:Prem Jain
Pensando旨在帮助企业使用定制的可编程P4处理器来利用AWS服务,该处理器可提供低功耗的大规模边缘服务。
这家总部位于美国加州米尔皮塔斯市的初创公司在今年11月宣布,已经获得了来自Qualcomm Ventures的投资,此前Pensando在去年10由Lightspeed Venture Partners和HPE领投的C轮融资中获得了1.45亿美元。Pensando还得到了前思科首席执行官John Chambers的支持,他也是Pensando公司的董事会主席。
Pensando在今年夏天宣布,在与HPE战略OME合作伙伴关系下,Pensando Distributed Service Platform将作为一个工厂要求的选件在HPE服务器上提供。
Pliops
首席执行官:Uri Beitler
Pliops由来自三星、M-Systems和XtremIO的闪存存储行业资深人士创立,旨在通过硬件加速器来改变数据中心存储的经济效益。
这家位于美国加州圣何塞的初创公司于2019年在B轮融资中获得来自英特尔、西部数据和赛灵思的3000万美元,今年7月宣布已经有10多家一级云厂商和大型企业测试了Pliops的存储处理器,结果证明存储性能可以提升10倍以上,延迟降低1000倍,闪存性价比提高90%多。
Pliops存储处理器的用途包括加速应用、动态扩展容量、驱动器故障保护、延长SSD使用寿命等。
SiFive
首席执行官:Patrick Little
SiFive致力于为人工智能、高性能计算和其他成长型市场提供处理器核心和定制芯片解决方案。这些解决方案基于开放的、免费的RISC-V指令集架构。
这家位于美国加州圣马特奥市的初创公司在今年8月宣布,已经在由SK Hynix领投的E轮融资中获得6100万美元,其他投资方还包括Western Digital Capital、Qualcomm Ventures和Intel Capital等你。9月,SiFive任命前高通高管Patrick Little为公司新任首席执行官。
SiFive今年还实现了其他几个里程碑,包括引入新的RISC-V处理器体系结构,对处理器IP产品组合进行了大规模更新,以及成立了专门打造特定用途片上系统的定制芯片业务部门。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。