近年来,由物联网设备、联网汽车和其他数字平台生成或即将生成的数据日益庞大,只靠云计算已经无法做到对这些数据进行即时处理和分析。并且就数据处理安全性而言,本月初发生的阿里云宕机事故再次给企业客户敲响了警钟。计算工作负载从云数据中心迁移到更靠近所处理的数据源的“边缘”位置已成为一种趋势。边缘计算不仅可大幅缩短数据的传输距离,消除网络带宽和延迟问题,最终提升应用和服务的效率和可靠性,降低运行成本。而且边缘化数据处理意味着大范围的云端或网络故障不会影响业务运转,即使云端操作中断,位于边缘侧的应用也能独立正常地运行。所以说边缘计算技术可以应用于诸多行业领域,潜力巨大。
边缘计算已经在很多领域得到了应用,其中包括无人零售、自动驾驶、安防前端智能化、工业级低时延应用、VR/AR即时对战类游戏、远程医疗等,而且5G时代的数据爆炸及多元化应用也催生了边缘计算的快速发展。边缘计算市场规模万亿可期,或许会成为与云计算平分秋色的新兴市场。杰和科技适时推出了新一代边缘计算服务器EN4B。
杰和EN4B是一款1U可上架的轻量计算型边缘服务器,采用英特尔C612服务器专用芯片组,支持英特尔® Broadwell-DE架构 Xeon-D系列高性能处理器(可配最大16核CPU),整机具有很强的数据处理和运算能力。标配有2个SFP+万兆光口,2个千兆以太网口,1个独立千兆IPMI 2.0网络管理口,网络性能强劲,专为多网应用方案而设计。该机器可搭载用于人工智能的计算卡NVIDIA Tesla P4,可对35路高清视频流进行实时转码和推理,胜任轻量计算的业务应用。EN4B采用工控机的高可靠性设计理念,抗震性强,轻小便携,适应苛刻的工作环境,可广泛应用在无人零售、智能工业、智能农业、智能物流、智慧交通、远程医疗等轻量计算的行业应用以及智能家居、可穿戴设备等消费级物联网应用环境中。
杰和EN4B配备紧凑型短机箱,轻小便携,兼容性高,拆卸简单维护方便,整机内部走线简洁,适应通用的工作环境。提供1个PCI-E 3.0 x16插槽,可灵活选配不同的PCI-E设备,支持上一张NVIDA Tesla P4卡或双口或是四口的半高网卡。整机提供4个DDR4内存插槽,支持UDIMM或RDIMM内存技术,最大扩展128GB,内存速度最大可达2133MT/s,满足高性能数据交换对大容量内存的需求。配备2块2.5英寸非热插拔SATA硬盘,提供1个M.2 SSD接口。标配集成2个SFP+万兆光口,2个千兆以太网口,外插一张4口网卡情况下,整机支持多达8个网口,多种网络选择,满足中小企业复杂的网络应用。整机提供1个150W直流电源,可有效保证整机满配下的供电稳定性,并且系统可根据业务负载情况智能调节电压,降低能耗,更好地应对能源和散热方面的限制以及满足绿色IT的要求。
IDC表示,到2020年,将有超过500亿的终端与设备联网,而有50%的物联网网络将面临网络带宽的限制,40%的数据需要在网络边缘分析、处理与储存。
传统云计算模型,源数据由生产者发送至云端,终端用户、智能手机、个人电脑等数据消费者向云中心发送使用请求。云计算利用大量CPU资源来处理数据,但万物互联环境下,传统云计算模型不能有效满足万物互联应用的需求,将边缘设备端海量数据发送到云端会造成网络带宽负载过大和计算资源浪费。而且传统云计算模型的隐私保护问题将成为万物互联架构中云计算模型的障碍,数据传输模块的能耗也较大。目前,大数据处理已经从以云计算为中心的集中式处理模式逐步向以万物互联为核心的边缘计算模式转变。传统的数据中心将向边缘侧延伸,边缘计算对网络服务的响应更快,能满足不同行业在实时业务、应用智能、安全与隐私保护等方面的基本需求,将逐步成为物理世界与数字世界之间的重要桥梁。
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。