作者:IEEE会士、河海大学信息科学与工程学院院长韩光洁教授
今天,2023中国算力大会第二届西部数谷算力产业大会在银川举行,本次大会以“算领新产业潮流,力赋高质量发展”为主题。我有幸受邀参会并接受了媒体采访。在中国发展算力,需要大力支持技术创新,寻求资源优化方法,同时建立完善的数据使用机制。算力基础设施是支撑算力发展的基础,中国的电信运营商在推动算力基础设施发展方面正在发挥积极作用。
算力发展既要保护创新活力,又要兼顾安全和监管
目前,制约算力发展的因素是多方面的,不能单单从算力本身出发。小到一个存储单元,大到赋能应用的全流程,从单一算法到全系统解决方案都在不同尺度下可能成为制约算力发展的关键。
具体来说,从算力设备及配套生产制造上,技术研发资源和运行能源的持续性投入是算力发展的基础。元器件材料加工的物性极限、晶片加工制程精细度、硬软件框架的适配度都是影响设备算力和能效呈现的要素。
就过程而言,算力重点服务于数据到模型的转化,无论是对DaaS亦或是MaaS,均需要保护服务对象的隐私,并且同时保证多源异构数据可通过计算转化成能够为赋能应用提供增量学习、持续学习乃至终身学习的解决方案。以上因素都有可能制约算力及其赋能应用的发展。
针对上述因素,我认为破解之道可以归纳为:大力支持技术创新,通过不断推动芯片技术的创新,寻找新的制造工艺、材料和结构,以提升算力,同时提升国产化设备与配套解决方案的使用占比。寻求资源优化方法,不仅仅依靠”东数西算”这样资源优化战略,也要纵向地在体系结构中寻求内部资源利用率的最大化,真正的做到可计算设备的物尽其用。此外,建立完善的数据使用机制(如统一的标准和规范)保护用户隐私,既保护算力发展的创新活力,又兼顾安全和监管的需要。
算力基础设施是支撑算力发展的基础
算力基础设施在全产业中具有重要的地位和作用。算力基础设施可以认为是支撑算力发展的基础,其组成包括数据中心、计算设备、网络设备以及相应的软件和管理系统等。
其中,数据中心、计算设备、网络设备是其三大基础核心部件,承载着大量的计算任务和数据处理需求。高性能的计算设备和通信设备能够提供强大的计算和传输能力,支持各种复杂的算法和应用。优质的算力基础设施可以提供稳定可靠的计算资源,提高计算效率和数据处理能力,从而推动赋能产业及其应用的创新和发展。
电信运营商积极推动算力产业的融合和创新
以中国移动、电信、联通为代表的电信运营商经过多年经营与发展在设备和数据运维方面拥有着丰富的经验,在构建算力基础设施中起到了至关重要的作用。运营商拥有庞大的网络基础设施和数据中心资源,可以提供稳定可靠的计算服务与数据服务。
同时,多年的运营以及我国人口基数的客观情况也促成他们在网络抗毁性和数据安全性方面处于优势地位。作为国内电信大数据的最主要的持有者以及多年ICT行业头部企业,三家能够站在先发视角与云计算、人工智能、物联网等领域的企业深度合作,共同研发和推广新的算力应用和服务,促进算力产业的融合和创新,助推了算力设施进一步发展。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。