5月16日,阿里云目前最先进的自研弹性计算技术架构“神龙(X-Dragon)”首次全方位曝光,这种新型的计算架构打破了过去物理机和虚拟机的隔阂,既保留了物理机的性能优势和硬件级隔离,又具备虚拟机的弹性资源、分钟级交付、全自动运维的优势。
知名科技作家张广彬(狒哥)参与了云计算史上首次开箱直播,真刀真枪“扒光”了一台服务器,并现场演示了如何快速创建和部署云服务。
图1:科技大咖狒哥现场直播神龙“开箱”
自研核心技术 融合物理机和虚拟机的神龙架构
传统的物理机虽然性能强大,但部署麻烦、扩展性是硬伤,虚拟化则有一部分性能损耗,选物理机还是选虚拟机成为企业部署IT时面临的难题。去年10月,阿里云发布了首个同时融合物理机和虚拟机特性的“跨界”云服务器,解决了这一难题,其背后的技术就是神龙架构。
图2:阿里云自研神龙技术架构之MOC卡
据悉,通过底层技术创新,阿里云研发团队自研了“X-Dragon虚拟化芯片”,“ X-Dragon Hypervisor系统软件”、以及“X-Dragon服务器硬件架构”,这三部分组成了今天的神龙架构。其中X-Dragon虚拟化芯片在芯片层解决了虚拟机和物理机体系结果不一致的问题,让二者能够在系统软件层面保持100%兼容。
现场同档规格实例的性能测试中,基于神龙架构的阿里云弹性裸金属实例ebmhfg5.2xlarge(8vCPU) 在10000位圆周率计算Superπ中跑出了1分26秒的成绩,比AWS基于Nitro架构计算型实例c5.2xlarge(8vCPU)快了15%。
此外,传统的Hypervisor(Xen,KVM等)完全是通过软件的形式实现的,神龙的一大创新在于融合了系统软件和芯片的能力,不仅仅是可以支持X86架构的芯片,还可以支持ARM,Power以及国产CPU等架构。这种优势让神龙架构可以无缝联入传统的云基础设施,保持产品和使用体验的一致。
更适合大型企业的计算架构 5分钟完成从创建到部署
大型企业客户上云更加重视性能与安全隔离等,需要在公共云上搭建和线下统一的虚拟化或专有云环境,关键业务需要更加安全性的云端加密执行环境,以及异构计算GPU加速能力等。阿里云虚拟化资深专家张献涛表示,神龙架构创新实现了性能“零”损耗、上云“零“障碍,100%兼容阿里云产品生态,充分满足企业关键应用系统、高强度工作负载应用等上云要求,为用户了提供一种新型的计算资源交付方式。
在现场演示环节中,狒哥仅用5分钟不到就完成了从创建到部署一台弹性裸金属服务器。“我们从一开始就希望打造一个能让用户无障碍使用的产品,不仅在性能上追求高效,在设计上我们更多考虑的是用户的时间成本。”张献涛表示。
目前,基于神龙架构的弹性裸金属服务器已正式商业化售卖,支持8核、16核、32核、96核等多个CPU规格,并支持3.7 GHz ~ 4.1 GHz的超高主频实例,未来将有更多的云产品采用神龙技术架构。
好文章,需要你的鼓励
新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4,专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集,在东南亚语言模型评估榜单中位居开源模型首位。模型支持119种语言,能在32GB内存的消费级笔记本上运行,采用字节对编码技术更好处理非拉丁文字,并具备3.2万词元上下文长度,可执行文档级推理和摘要任务。
中科大联合快手等机构推出VR-Thinker技术,首次实现AI视频评判员的"边看边想"能力。该系统通过主动选择关键画面、智能记忆管理和三阶段训练,在视频质量评估准确率上达到75%-82%,特别擅长处理长视频场景,为AI视频生成的质量控制提供了突破性解决方案。
AI智能体是下一代业务自动化工具,不仅能对话交流,还能执行复杂任务。与ChatGPT聊天机器人不同,它们可在最少人工干预下规划并完成工作。文章介绍了五个高影响力应用:自动化客户服务解决方案、销售CRM管理、合规自动化、招聘筛选与排程、市场情报报告。这些应用都具有重复性工作流程、依赖结构化数据、遵循可预测规则等特点,能够释放员工宝贵时间用于更有价值的工作。
微软研究院发布BitDistill技术,通过三阶段优化将大型语言模型压缩至1.58位精度,在保持性能的同时实现10倍内存节省和2.65倍速度提升。该技术包括模型结构稳定化、持续预训练适应和知识蒸馏传承三个关键步骤,解决了模型量化中的性能衰减和规模化问题,为AI模型在资源受限设备上的高效部署提供了新方案。