低功耗计算机芯片初创公司Efficient Computer Co.今日宣布推出其全新旗舰产品Electron E1处理器,大幅降低了通用计算工作负载的能耗需求。
Electron E1处理器现已面向开发者提供,同时推出的还有该公司全新的effcc编译器,这是一款帮助简化应用程序与硬件集成的工具。
Efficient Computer的新芯片基于该公司所称的创新"织物架构"(Fabric architecture),旨在实现空间数据流计算。这与传统计算机芯片(如英特尔公司基于冯·诺伊曼架构的x86芯片)采用了根本不同的方法,在能效方面实现了显著提升。
该公司解释说,冯·诺伊曼芯片浪费大量能源,因为它们需要不断在内存和处理核心之间来回传输数据。通过消除这种开销,Efficient Computer表示可以将某些计算工作负载的能效提高多达100倍。
这使得Electron E1成为部署边缘计算设备(如传感器、可穿戴设备和无人机)的理想选择,这些设备通常需要依靠电池供电,因此需要谨慎节约能源以延长运行时间。
"我们正在做的事情具备CPU的能力,但效率却高出一到两个数量级,"Efficient Computer联合创始人兼首席执行官Brandon Lucia在接受IEEE Spectrum采访时表示。
**织物数据流架构**
通过全新的织物架构,Efficient Computer表示能够将软件程序的指令进行空间布局,而不是像冯·诺伊曼芯片那样从内存中顺序处理它们。
基本上,冯·诺伊曼芯片从内存中逐个接收指令。这些指令告诉处理器如何处理数据——例如,将其与某些内容相加、反转或改变格式——然后将操作结果返回内存。之后,它向处理器发送下一条指令,处理器执行所需操作并返回结果,如此反复。
冯·诺伊曼方法的问题在于其极其低效,指令从内存中提取、处理并返回结果,每秒发生数十亿次。这消耗大量能源,还存在额外开销,比如需要分支预测逻辑来预测下一条指令。
另一方面,Electron E1将整个指令序列映射为数据移动的空间路径。据Lucia介绍,可以将其视为按序列连接的"瓦片阵列"。每个瓦片本质上是一个精简的处理器核心,能够执行一系列指令,但没有获取、分支预测和其他开销。
effcc编译器读取软件程序并将每条指令分配给特定的瓦片。指令处理完成后,其结果成为下一个瓦片的输入。所有指令都按正确顺序排列,通过消除与内存的持续往返通信,使程序运行更加高效。如果程序序列出现分支(如遇到if/then/else场景),瓦片的空间模式也会相应改变,类似于铁路操作员切换开关来改变铁轨。
Efficient Computer表示,Electron E1针对嵌入式和边缘人工智能工作负载,这些工作负载受到现有中央处理器限制的困扰。该芯片已开始向各个工业和航空航天垂直领域的早期客户提供样品。
该公司还计划推出更强大的芯片版本Photon P1,将其空间计算架构扩展到更大规模的边缘计算工作负载。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。