从玛雅历法到圆周率,从万有引力到二进制,科技技术的持续飞跃,为计算注入新能量。如今,随着人工智能、IOT及数字化等新型技术的驱动,人类已然进入了一个全新数字和智能云时代。
新技术的迅速崛起,让计算面临着各种挑战。华为作为国内知名企业,正试图通过创新的力量,让计算变得更简单。
7月6日下午,华为在北京发布"无边界计算"服务器战略及系列解决方案。本次发布会,华为不仅回顾了其过去4年服务器的发展历程,而且阐述了其全新的"无边界计算"服务器战略,并发布了V5系列解决方案。腾讯作为华为的合作伙伴,其服务器运维总监林哲伟出席发布会并分享了腾讯服务器的运营管理经验。
腾讯从成立至今,IDC从0到现场300个,服务器数量已增至70万台,运营之路从最开始的人工支持模式演变到工业标准化。林总表示:"随着云时代的来临,腾讯IDC带来诸多挑战,其中服务器的质量和弹性最为明显。"
到底腾讯传统业务和云业务有哪些区别?林总提到,区别主要体现在两个方面:一是对传统业务要求服务器的稳定性,而如今更多的还是以服务为主,并且对服务器质量要求极高;二是弹性,云对服务器的硬件配置及运营服务的要求很高,对存储型服务器、接入性服务器或基础型服务器都有不同需求。因此,高质量、弹性灵活的配置是目前云的主要诉求。
"腾讯是服务器的使用者,并不是生产者,主要通过与各大厂商深入合作来把控服务器链条的质量。目前已经和厂商介绍服务器运营硬件的研发,同时,腾讯对服务器引入生产及中途运营、掌控方面均做了全质量的闭环体系,以控制服务器质量链条。" 林总介绍到。
众所周知,在云计算的驱动下,弹性一词时常被提及。而腾讯在使用服务器过程中,打造了自有的CTO硬件服务能力,在部件采集、审计过程中均做到标准化。林总认为,腾讯不仅仅是服务器的使用者,更像是弹性服务器的缔造者。
在演讲的最后,林总提到了腾讯的一款"黑石物理机"的产品,区别于公有云,黑石物理机是全封闭的黑色云,与云主机同样方便使用,同时也是腾讯运营能力的一种体现,拥有多、快、省等优势,支持多种硬件配置及OS。通过华为FDM技术,可以很快帮助用户定位到故障原因。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。