模型压缩文章列表第1页-至顶网频道

模型压缩关键字列表

人工智能

模型压缩

量子算法

2025-08-15

欧洲AI明星公司发布全球最小高性能模型

西班牙AI初创公司Multiverse Computing发布两款超小型AI模型，分别命名为"鸡脑"和"苍蝇脑"。该公司声称这是全球最小的高性能模型，具备聊天、语音和推理能力。这些模型专为物联网设备、智能手机和平板电脑设计，可在无网络连接情况下本地运行。公司采用量子启发的CompactifAI压缩技术，在不牺牲性能的前提下大幅缩小模型体积。

人工智能

模型压缩

架构优化

2025-06-23

AI系统现代架构优化的六大发展方向

随着AI模型参数达到数十亿甚至万亿级别，工程团队面临内存约束和计算负担等共同挑战。新兴技术正在帮助解决这些问题：输入和数据压缩技术可将模型压缩50-60%；稀疏性方法通过关注重要区域节省资源；调整上下文窗口减少系统资源消耗；动态模型和强推理系统通过自学习优化性能；扩散模型通过噪声分析生成新结果；边缘计算将数据处理转移到网络端点设备。这些创新方案为构建更高效的AI架构提供了可行路径。

人工智能

模型压缩

量子算法

2025-06-13

Multiverse Computing获2.15亿美元融资，推进量子启发AI模型压缩技术

Multiverse Computing宣布完成2.15亿美元B轮融资，用于加速部署其量子计算启发的AI模型压缩技术。该技术可将大语言模型体积缩小95%而不影响性能表现，大幅降低AI推理成本。公司的CompatifAI技术采用量子启发算法和先进张量网络，能识别并剔除AI模型中的冗余部分。压缩后的模型运行速度提升4-12倍，推理成本降低50%-80%，可在云端、本地数据中心甚至边缘设备上运行。