大模型的发展离不开云计算厂商的算力加持
ChatGPT的持续走红不光让人们对人工智能的发展充满期待,同时也对云计算产业产生深刻的影响。因为在ChatGPT的发展过程中,我们看到微软的Azure发挥了不可估量的作用。
大模型的训练底层依托GPU算力资源、高性能的存储与网络,因此大模型的发展与云计算息息相关。
在青云科技看来,具备底层IaaS资源的云厂商与大模型厂商的合作是发展趋势之一,两者之间可以互相补足能力,基础设施服务的搭建、灵活弹性的云资源算力、成熟的运维监控体系都能很好地弥补大模型厂商在算力和模型训练上缺失的能力。
云计算的边界越来越模糊
在传统的认知中,云计算是按照IaaS、PaaS和SaaS进行划分的。但是进入到大模型时代,我们看到,这种分层的边界已经越来越模糊,云厂商需要基于用户的使用场景,提供细分客群的差异化产品,比如基于行业特征的PaaS服务、低代码服务等。
AI模型的训练包含算力搭建、数据采集、数据清洗、数据分析、算法、训练以及推理等多个方面,此前用户需要具备一套成熟的研发团队才可以进行AI产品的投入。
服务化的背后是专业的分工,于是我们看到为了抓住机遇,专注于大模型的公司打磨其产品,从而提供相应的能力。
MaaS(模型即服务)这一全新服务也涌现出来。就像云计算的出现是为了消除用户获取IT资源的复杂性,MaaS帮助用户屏蔽复杂的技术,尤其是AI相关的重投入的技术。MaaS能让客户以最小的成本,快速使用模型服务构建其专属的AI产品。
青云科技认为,MaaS将会是一种趋势,但是不会一蹴而就,而是一个循序渐进的过程。因为随着数据量级(token参数)的增多,其精准度和认知能力上会随着数据量的增加、算法模型的优化而不断的发展,这是一个长期发展的过程。
大模型也是一种资源
大模型与云计算提供的资源是紧耦合的,对于大模型服务来说,多了一个大模型的成本。这对于云厂商而言是一种机会。因为一种新的成本,意味着一种新的商业机会。
大模型对于算力的需求与日俱增,GPU的相关产品也需要随着迭代和更新,云厂商能够提供稳定的算力支持,强大的技术支撑团队,以及快速响应客户的AI需求,协助客户在大模型领域落地相应的产品和项目。比如青云公有云提供包括了e系列云服务器、EHPC高性能计算、GPU云服务器等的多元算力,存储及网络服务。
青云科技表示,在认知层面,云厂商一定要正视大模型,将其视为和计算、存储、网络等平等的地位。云厂商需要调整现有服务和解决方案,适应大模型的产品和服务。“对第三方云厂商来说首先服务好现有客户,通过大模型或者其他AI技术在现有客户面前增值,并且能够真的基于用户的使用场景为用户提供一个可落地的大模型服务。”
目前,云计算厂商计划进一步打造自身的大模型能力,而一些大模型公司也会加入到与云平台的竞争中,所以大模型的出现是一场变革,变革意味着机会,未来各个行业都会用到大模型,机遇与挑战适用于变革中的每一家公司。
结语
大模型的竞争是一种长期主义的竞争。
云计算平台服务千行百业的定位不会变,为用户提供多样性业务的基础能力的需求不会改变。云厂商的能力需要更加多样化,并与更多的公司/组织/机构合作。
回到青云科技自身,青云一直都秉承客户至上的原则,从客户的需求出发,除了做好稳定的算力支持,青云具备与其他技术领域整合的专业能力,也可以从生态发展上接入大模型服务的能力,联合专业的AI团队提供多方位的服务,从训练数据集收集、训练、推理、算力平台建设、多模态支持、定制化模型、公私混合云模式部署等产业全链路提供支持,让客户不用投入巨大成本就能跟上这轮变革,专注自身业务。
好文章,需要你的鼓励
研究显示,英国中小企业虽占企业总数99.9%,但因资源与专业不足,难以有效应对网络攻击。CyCOS项目旨在通过构建支持社区,帮助中小企业提升网络防御能力。
上海交大研究团队开发的VideoREPA是一种突破性的视频生成框架,通过令牌关系蒸馏技术将视频理解模型中的物理知识转移到文本到视频(T2V)扩散模型中。与传统方法不同,VideoREPA关注空间和时间关系的对齐,使生成的视频更符合物理常识。实验表明,这种方法在VideoPhy基准测试中将物理常识分数提高了24.1%,明显优于现有技术。该研究为创建更真实的AI生成视频提供了新思路,展示了理解能力与生成质量间的密切关联。
Wispr 的 Flow 是一款创新的 iOS 语音输入软件,借助 AI 技术能将语音无缝转换为精美文字,每周免费 2000 字,支持 100 多种语言,并能实现多设备同步。
浙江大学和莫纳什大学研究团队开发了PM-Loss,一种用于改进前馈式3D高斯分布渲染的新型正则化损失函数。研究针对深度图在物体边界处的不连续性问题,通过预训练Transformer模型预测的点图提供几何先验知识,实现了更平滑、准确的3D场景重建。实验表明,PM-Loss在多个数据集上显著提升了渲染质量,PSNR提高至少2dB,特别改善了物体边界处的细节表现。该方法易于集成到现有模型中,无需修改架构,为3D视觉和图形学领域提供了新的研究思路。