Multiverse Computing宣布完成2.15亿美元B轮融资,用于加速部署其量子计算启发的AI模型压缩技术。该技术可将大语言模型体积缩小95%而不影响性能表现,大幅降低AI推理成本。公司的CompatifAI技术采用量子启发算法和先进张量网络,能识别并剔除AI模型中的冗余部分。压缩后的模型运行速度提升4-12倍,推理成本降低50%-80%,可在云端、本地数据中心甚至边缘设备上运行。
微软团队推出名为 BitNet b1.58 2B4T 的 2 亿参数 1 位模型,通过将权重量化为 -1、0、1,实现了内存和运算效率的显著提升,并能在 CPU(如苹果 M2)上运行,但目前仅支持特定硬件。