图:Robert Hof/SiliconANGLE
VMware公司日前推出混合云平台Cloud Foundation 5.0、该平台在可扩展性、安全性和部署的简易性方面都有改进。
周四宣布推出的这个版本包括管理程序8.0 Update 1的VMware vSphere、vSAN存储虚拟化层8.0 Update 1、用于网络和安全虚拟化的NSX 4.1以及用于云管理的vRealize LifeCycle Manager 8.10。
新版本的一个亮点是提供了孤立的SSO工作负载域,这项功能允许管理员使用单独的单点登录实例配置新的工作负载域。该功能的主要用户是那些需要工作负载隔离的企业以及希望将工作负载域分配给拥有自己的SSO域的不同租户的管理服务提供商。
隔离的SSO域都配置了自己的NSX实例,用户可以选择配置一个单独的身份提供者,例如微软的活动目录或开源的LDAP。该选项目前最多限15个域,但可以通过任务并行化实现额外的扩展。
VMware的Software-Defined Data Center Manager利用预检查确保基础设施堆栈已准备好接受所需的更新并确保部署以正确的顺序更新到所需的Cloud Foundation版本。预检查现在上下文感知,即是说SDDC Manager安装或升级到5.0版本后,管理员就可以选择将他们的云基础域更新到较新的Cloud Foundation 5.x目标版本,并且可以针对特定的Cloud Foundation版本运行预检查,或执行“一般更新准备”预检查,确保一般准备就绪。
管理员现在还可以利用SDDC Manager查看升级中某部分的任何配置变化,可以更好地了解可能影响部署的新功能。
3月推出的VSphere 8.0 Update 1包括几个专门针对Cloud Foundation 5.0的增强功能。对Nvidia公司NVSwitch的支持使得工作负载域可以获得增强的运行效率、安全更新和更好的人工智能工作负载的性能。直通模式下现在最多支持32个设备,管理员可以增加可用的GPU资源。每个虚拟机最多可以支持八个虚拟图形处理单元。
VSphere分布式资源调度器现在将工作负载的内存使用情况纳入了安置决策,并能根据内存需求、带宽和延迟要求优化安置工作负载。
VSAN 8 Update 1增加了对性能指标的高分辨率监控,现在默认的收集间隔为每30秒收集一次,可以进行近乎实时的实时分析和故障排除。
虚拟机输入/输出行程分析器(Trip Analyzer )的新功能得到了增强,客户可以安排对虚拟机的分析,可以指定时间、持续时间和频率。
可用于监控集群组件的状态的VSAN Skyline Health重新设计了用户界面,界面包括每个集群的健康状态的简化视图,涵括影响区域、解决步骤和对诸如知识库文章的额外资源的访问。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。