大模型的发展离不开云计算厂商的算力加持
ChatGPT的持续走红不光让人们对人工智能的发展充满期待,同时也对云计算产业产生深刻的影响。因为在ChatGPT的发展过程中,我们看到微软的Azure发挥了不可估量的作用。
大模型的训练底层依托GPU算力资源、高性能的存储与网络,因此大模型的发展与云计算息息相关。
在青云科技看来,具备底层IaaS资源的云厂商与大模型厂商的合作是发展趋势之一,两者之间可以互相补足能力,基础设施服务的搭建、灵活弹性的云资源算力、成熟的运维监控体系都能很好地弥补大模型厂商在算力和模型训练上缺失的能力。
云计算的边界越来越模糊
在传统的认知中,云计算是按照IaaS、PaaS和SaaS进行划分的。但是进入到大模型时代,我们看到,这种分层的边界已经越来越模糊,云厂商需要基于用户的使用场景,提供细分客群的差异化产品,比如基于行业特征的PaaS服务、低代码服务等。
AI模型的训练包含算力搭建、数据采集、数据清洗、数据分析、算法、训练以及推理等多个方面,此前用户需要具备一套成熟的研发团队才可以进行AI产品的投入。
服务化的背后是专业的分工,于是我们看到为了抓住机遇,专注于大模型的公司打磨其产品,从而提供相应的能力。
MaaS(模型即服务)这一全新服务也涌现出来。就像云计算的出现是为了消除用户获取IT资源的复杂性,MaaS帮助用户屏蔽复杂的技术,尤其是AI相关的重投入的技术。MaaS能让客户以最小的成本,快速使用模型服务构建其专属的AI产品。
青云科技认为,MaaS将会是一种趋势,但是不会一蹴而就,而是一个循序渐进的过程。因为随着数据量级(token参数)的增多,其精准度和认知能力上会随着数据量的增加、算法模型的优化而不断的发展,这是一个长期发展的过程。
大模型也是一种资源
大模型与云计算提供的资源是紧耦合的,对于大模型服务来说,多了一个大模型的成本。这对于云厂商而言是一种机会。因为一种新的成本,意味着一种新的商业机会。
大模型对于算力的需求与日俱增,GPU的相关产品也需要随着迭代和更新,云厂商能够提供稳定的算力支持,强大的技术支撑团队,以及快速响应客户的AI需求,协助客户在大模型领域落地相应的产品和项目。比如青云公有云提供包括了e系列云服务器、EHPC高性能计算、GPU云服务器等的多元算力,存储及网络服务。

青云科技表示,在认知层面,云厂商一定要正视大模型,将其视为和计算、存储、网络等平等的地位。云厂商需要调整现有服务和解决方案,适应大模型的产品和服务。“对第三方云厂商来说首先服务好现有客户,通过大模型或者其他AI技术在现有客户面前增值,并且能够真的基于用户的使用场景为用户提供一个可落地的大模型服务。”
目前,云计算厂商计划进一步打造自身的大模型能力,而一些大模型公司也会加入到与云平台的竞争中,所以大模型的出现是一场变革,变革意味着机会,未来各个行业都会用到大模型,机遇与挑战适用于变革中的每一家公司。
结语
大模型的竞争是一种长期主义的竞争。
云计算平台服务千行百业的定位不会变,为用户提供多样性业务的基础能力的需求不会改变。云厂商的能力需要更加多样化,并与更多的公司/组织/机构合作。
回到青云科技自身,青云一直都秉承客户至上的原则,从客户的需求出发,除了做好稳定的算力支持,青云具备与其他技术领域整合的专业能力,也可以从生态发展上接入大模型服务的能力,联合专业的AI团队提供多方位的服务,从训练数据集收集、训练、推理、算力平台建设、多模态支持、定制化模型、公私混合云模式部署等产业全链路提供支持,让客户不用投入巨大成本就能跟上这轮变革,专注自身业务。
好文章,需要你的鼓励
英国科学、创新与技术部(DSIT)与思科签署合作备忘录,框架延伸至2030年,旨在借助AI和数字技术推动经济增长、提升公共服务水平并培育数字技能。合作核心包括:将巴恩斯利打造为英国首个"科技城镇"、探索医疗健康实验室建设、支持百万中学生接触AI教育,以及通过思科网络学院帮助更多人掌握数字技能。过去一年,思科已帮助10万人完成技能培训。
耶鲁大学研究团队证明两层神经网络在学习有限群运算时,梯度下降自发驱动每个神经元收敛到单一不可约群表示,并在傅里叶域实现秩一旋转对齐,揭示了特征学习的表示论机制。
微软AI首席执行官穆斯塔法·苏莱曼近日公开表示,Anthropic的AI服务价格过高,许多用户正在寻找替代方案。与此同时,微软在年度Build大会上发布七款新AI模型,主打低成本优势,希望帮助企业实现AI项目的商业可行性。据悉,微软还计划于6月底取消大部分Claude Code授权,将工程师转移至自家Copilot工具,显示出其在AI开发者工具市场上的竞争意图。
强化学习训练的大语言模型可在无任何指令的情况下自发发现社会规章制度漏洞,现有安全机制对此几乎无效,这一现象或将重塑AI安全防护框架。