“人工智能带来指数级增长的算力需求,一方面多样化的智能场景需要多元化的算力,巨量化的模型、数据和应用规模需要巨量的算力,算力已经成为人工智能继续发展的重中之重;另一方面从芯片到算力的转化依然存在巨大鸿沟,多元算力价值并未得到充分释放。如何快速完成多元芯片到计算系统的创新,已经成为推动人工智能产业发展的关键环节。”在10月26日举行的2021人工智能计算大会(AICC2021)上,中国工程院院士、浪潮首席科学家王恩东阐释了计算系统创新在计算到智算转变的产业新格局下的重大意义。
随着人工智能在算法领域的不断突破,不同数值精度带来了跨度更大的计算类型,对计算芯片指令集、架构的要求更加细分。图灵奖获得者 John Hennessy和 David Patterson共同发表的《计算机架构的新黄金时代》中提出:当摩尔定律不再适用,一种更以硬件为中心的针对特定问题领域定制设计计算机体系架构的方法DSAs(Domain-Specific Architectures)会成为主导,这种设计的核心在于针对特定问题或特定领域来定义计算架构。基于DSAs思想设计的AI芯片,在特定AI工作负载上表现出远超通用芯片的处理能力,大大推动了AI芯片的多元化发展。
王恩东认为,芯片多元化为产业AI化的加速提供了重要的产业基础和更加丰富的选择。但是,芯片从造出来到大规模用起来,还存在巨大的产业鸿沟,“因此,如何将百花齐放的AI芯片转变成一个通用性强、绿色高效、安全可靠的计算系统,变得至关重要。”
然而,由于AI芯片在单一计算系统中往往高密度集成,带来系统功耗、总线速率、电流密度的不断提升,AI计算系统的设计面临巨大挑战。例如一台浪潮AI服务器,需要整合超过10000个零部件,包含50多类专用芯片、30多个技术方向以及100多种传输协议,涉及到材料、热力学、电池技术、流体力学、化学等一系列学科;需要经历30多个流程、150多种加工和制造的工艺、280多个关键过程的控制点,如何确保整个系统的可靠性是一个非常精细且复杂的工程。
“从火箭发动机到运载火箭,要在循环、控制、结构等很多领域做大量的工作。芯片到计算系统同样如此,需要完成体系结构、信号完整性、散热、可靠性等大量系统性设计工作。”王恩东院士用一个生动形象的比喻,描述了计算系统创新的难度。
值得关注的是,计算系统创新的根本目的,就是要让算力、算法和数据去服务数字经济,去支撑科研创新,去推动智慧转型,这就需要加大以智算中心为代表的新型人工智能基础设施建设,以此推动AI产业化、产业AI化和政府治理的智能化。
对此,王恩东院士强调说:“我们一方面要重视智算系统的创新,加大人工智能新型基础设施建设,把从技术到应用的链条设计好,从体系结构、芯片设计、系统设计、系统软件、开发环境等各个领域形成既分工明确又协同创新的局面。同时,也要加快推动开放标准建设,通过统一的、规范的标准,将多元化算力转变为可调度的资源,让算力好用、易用。”
好文章,需要你的鼓励
Ubuntu 25.10和Fedora 43的下一个版本将在GNOME变体中仅支持Wayland,这是因为GNOME 49将移除X11会话。此变化只影响GNOME版本,两个发行版仍提供其他桌面环境选项。GNOME项目还计划引入对systemd的更强依赖,这将使GNOME在非Linux系统上运行变得更困难。尽管存在用户阻力,但Red Hat作为主要赞助商推动了这一转变。
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
金融科技公司Chime在纳斯达克首日交易表现强劲,股价上涨超过37%。公司IPO定价每股27美元,筹资约7亿美元,收盘价达37.11美元。Chime第一季度营收5.187亿美元,同比增长32%,净利润1270万美元,是少数盈利上市的科技公司。截至3月底,公司拥有860万活跃用户,同比增长23%。作为数字银行服务商,Chime主要服务年收入10万美元以下客户群体,提供免费支票账户等服务。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。