OpenStack基金会已经开始着手研究,希望使其软件成为运行机器学习类工作负载的理想平台。
该基金会执行董事Jonathan Bryce在今天接受采访时解释称,“今年以来,机器学习的发展态势有点像去年的边缘计算。”这意味着用户开始考虑如何借此完成自家业务,或者希望掌握与之相关的知识资讯。今年,“我听到了大量来自OpenStack用户的声音,他们正在运行机器学习负载,并询问还有哪些人也在采取同样的举措。”
去年当该基金会听到成员们关于边缘计算的讨论声音时,他们即开始研究扩展平台的功能性,而其中一些功能目前已经研发完毕。
Bryce指出,OpenStack还没有正式迈入机器学习领域,但他补充称“我们已经与英伟达方面进行过会议交流。英伟达公司已经开始开发能够在我们的环境中拥有更佳运行表现的驱动程序。”
Bryce认为,此次会议以及其它相关措施意在“努力弄清我们应该关心的趋势性因素。”
他很清楚该基金会需要完成哪些任务,从而面向机器学习进行OpenStack调整。他总结道,“用户并不希望使用虚拟机,他们希望使用超级抽象化云与不同的I/O类型。”Bryce也意识到,接下来的任务当中将必须包含基金会自身向机器学习领域的迈进。“每一次与英伟达交流,英特尔都希望能够获得同样的沟通机会。”
好文章,需要你的鼓励
博通宣布对VMware Cloud Foundation平台进行重大升级,将私有AI服务集成到核心订阅中,并为vSAN存储虚拟化软件添加云原生对象存储支持。此举旨在满足企业对简化基础设施、高效AI采用和网络安全的需求。升级包括与英伟达合作的VMware Private AI Foundation服务、支持AMD GPU、Amazon S3兼容对象存储、与Canonical合作的Ubuntu容器镜像,以及新的四阶段自动化安全流程。博通还推出了面向高监管行业的VCF网络合规高级服务。
谷歌DeepMind研究团队开发出革命性AI训练方法,让AI学会深度思考。通过"连续推理空间"技术,AI能在回答前进行内部分析和规划,一次性提供高质量解决方案。新方法在数学推理、逻辑分析等任务中表现显著提升,错误率明显降低。该技术有望应用于教育、医疗、商业咨询等领域,为用户提供更智能可靠的AI助手服务。
Google正式发布Gemini 2.5 Flash Image模型,该模型此前在测试版中被称为nanobanana。新模型为企业创意项目提供更多选择,能够快速修改图像外观并提供比以往模型更强的控制能力。该模型在保持人物相似度和编辑一致性方面表现出色,支持多轮编辑、照片融合等功能,并已集成到Gemini应用中供付费和免费用户使用。
这项研究展示了一种革命性的AI技术,能够仅通过音频生成高度逼真的说话视频。滑铁卢大学研究团队开发的Audio2Photoreal系统巧妙结合了深度学习、扩散模型等先进技术,实现了声音到面部动作的精准转换。该技术在影视制作、在线教育、新闻媒体等领域具有广阔应用前景,将大幅降低视频制作成本和门槛。虽然仍面临计算资源需求高、隐私安全等挑战,但其突破性创新为未来视频内容创作开辟了全新路径。