2024年,随着人工智能技术的飞速发展,全球各行各业都在积极探索如何将AI技术应用于实际生产和生活中,而这里不开人工智能基础设施的建设。
人工智能基础设施为人工智能技术的发展和应用提供了坚实的基础。它支持着人工智能在各个领域的应用,如智能语音助手、自动驾驶、智能医疗、智能金融等。随着人工智能技术的不断进步和应用场景的不断扩大,人工智能基础设施的重要性也将越来越凸显。
在此背景下,2024人工智能基础设施峰会暨超云新品发布会在北京举行。会上,超云联合生态伙伴发布了2024人工智能产品家族,涵盖智算、液冷、信创、存储以及云服务等。
亚信联合创始人、宽带资本董事长田溯宁在峰会的致辞中强调,“我们正处在一个大变革的时代,从小型机到个人计算机再到云计算的兴起,每一次技术革新都带来了企业形态和社会形态的巨大变化。如今,我们迎来了人工智能时代,算力将成为未来社会的基础设施。”
新时代孕育新生态,在人工智能时代,算力是构成人工智能生态的核心之一。超云总裁房玉震在“新时代、新生态、新战略”的致辞发言中强调,以往我们提到的更多是狭义的计算力,它代表了加速服务器等硬件的强大性能。在AI时代,算力不再局限于传统的硬件性能,而是涵盖了硬件、软件、网络、存储、AIDC乃至能源等多个方面,形成了更为广泛的算力系统。
近两年来,人工智能正以前所未有的速度渗透到千行百业。在这一过程中,AI算力需求呈现井喷式增长,智能算力规模也实现了显著的高速扩张。超云CTO付迪在演讲中明确指出,超云秉持“AI IN ALL”的战略理念,全面融合AI技术以驱动企业的数字化转型,精心打造一体化解决方案,进而实现智能化升级并显著提升运营效率。同时,超云还将以多元算力、智能管理、高效算能和安全底座为支撑,以满足多样化场景需求为出发点,打造智能、高效的算力产品。
随着人工智能技术的快速发展,传统IDC(Internet Data Center,互联网数据中心)逐渐向AIDC(Artificial Intelligence Data Center,人工智能数据中心)转型。这一转型旨在满足日益增长的人工智能计算需求,提升数据处理和分析能力,为各行各业提供更加智能化的数据服务。
在当前AIDC建设的进程中,企业面临着多重挑战,包括能力跨度大、改造难度高、运维投入大、升级风险及部署挑战等。超云技术支持中心总经理张春雨介绍到,凭借“超云+生态”的强强联合模式,超云能够为客户提供全面的AI全栈智算中心方案。这一方案不仅贯穿“投-建-运”的全流程,还能满足客户多样化的建设需求,进而助力客户实现业务价值的最大化。
此外,超云与西云算力还共同发布了《AIDC基础设施建设白皮书》。该白皮书对智算中心的定义、建设背景、关键原则以及广泛应用场景进行了全面而深入的剖析,为智算中心的建设者、运营者、政策制定者、行业分析师和学术研究人员提供了一份详尽且实用的参考资料。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。