5月16日,阿里云目前最先进的自研弹性计算技术架构“神龙(X-Dragon)”首次全方位曝光,这种新型的计算架构打破了过去物理机和虚拟机的隔阂,既保留了物理机的性能优势和硬件级隔离,又具备虚拟机的弹性资源、分钟级交付、全自动运维的优势。
知名科技作家张广彬(狒哥)参与了云计算史上首次开箱直播,真刀真枪“扒光”了一台服务器,并现场演示了如何快速创建和部署云服务。
图1:科技大咖狒哥现场直播神龙“开箱”
自研核心技术 融合物理机和虚拟机的神龙架构
传统的物理机虽然性能强大,但部署麻烦、扩展性是硬伤,虚拟化则有一部分性能损耗,选物理机还是选虚拟机成为企业部署IT时面临的难题。去年10月,阿里云发布了首个同时融合物理机和虚拟机特性的“跨界”云服务器,解决了这一难题,其背后的技术就是神龙架构。
图2:阿里云自研神龙技术架构之MOC卡
据悉,通过底层技术创新,阿里云研发团队自研了“X-Dragon虚拟化芯片”,“ X-Dragon Hypervisor系统软件”、以及“X-Dragon服务器硬件架构”,这三部分组成了今天的神龙架构。其中X-Dragon虚拟化芯片在芯片层解决了虚拟机和物理机体系结果不一致的问题,让二者能够在系统软件层面保持100%兼容。
现场同档规格实例的性能测试中,基于神龙架构的阿里云弹性裸金属实例ebmhfg5.2xlarge(8vCPU) 在10000位圆周率计算Superπ中跑出了1分26秒的成绩,比AWS基于Nitro架构计算型实例c5.2xlarge(8vCPU)快了15%。
此外,传统的Hypervisor(Xen,KVM等)完全是通过软件的形式实现的,神龙的一大创新在于融合了系统软件和芯片的能力,不仅仅是可以支持X86架构的芯片,还可以支持ARM,Power以及国产CPU等架构。这种优势让神龙架构可以无缝联入传统的云基础设施,保持产品和使用体验的一致。
更适合大型企业的计算架构 5分钟完成从创建到部署
大型企业客户上云更加重视性能与安全隔离等,需要在公共云上搭建和线下统一的虚拟化或专有云环境,关键业务需要更加安全性的云端加密执行环境,以及异构计算GPU加速能力等。阿里云虚拟化资深专家张献涛表示,神龙架构创新实现了性能“零”损耗、上云“零“障碍,100%兼容阿里云产品生态,充分满足企业关键应用系统、高强度工作负载应用等上云要求,为用户了提供一种新型的计算资源交付方式。
在现场演示环节中,狒哥仅用5分钟不到就完成了从创建到部署一台弹性裸金属服务器。“我们从一开始就希望打造一个能让用户无障碍使用的产品,不仅在性能上追求高效,在设计上我们更多考虑的是用户的时间成本。”张献涛表示。
目前,基于神龙架构的弹性裸金属服务器已正式商业化售卖,支持8核、16核、32核、96核等多个CPU规格,并支持3.7 GHz ~ 4.1 GHz的超高主频实例,未来将有更多的云产品采用神龙技术架构。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。