ZD至顶网服务器频道 05月23日 新闻消息: 一年之前,Gartner公司曾经将OpenStack定义为一个“科学项目”。然而在与国家计算基础设施协会的Andrew Howard进行沟通时,他结合澳大利亚规模最大的OpenStack部署方案给出了不同观点。
在这座占地面积900平方米的数据中心内承载着30PB数据,且利用AARnet作为组成部分接入NECTAR。Howard在采访中表示,NCI以OpenStack为基础的软件定义网络改变了研究人员们的固有思维方式。
十年之前,他指出,大多数研究人员都选择使用一台高端PC并希望其中提供充裕的磁盘空间来运行各类应用。如果将其中一部分参数集交由IT部门来打理,那么恐怕没有任何一套技术支持体系能够顺利接管。
然而时至今日,Howard表示,“大家可以运行自己的计算任务并将数据存储在国家级设施当中。如今可供支配的计算资源较本地环境更为丰富,我们也能够把处理结果通过网络传回设施内部。”
“它改变了资源的消费方式,也让研究人员拥有了超越部门甚至是高校级别的资源支配能力。由于项目本身是由联邦政府赞助的,因此几乎任何其它组织都无法在规模上与之比肩。”
作为澳大利亚早期互联网规划的参与者之一,Howard亦投身于OpenFlow早期开发并在NCI考虑使用OpenStack之后拿出三年半时间进行研究,因此他对于OpenStack如今的表现有着相当深入的理解。
相较于基于TCP/IP的路由机制——大家可以将其理解成世界上最原始的“SDN”——SDN的核心实质在于“对数据流进行进一步细分处理”,Howard解释道。
这对于NCI当然是一件大事,因为其科学高性能计算体系专门面向规模庞大但周期相对较短的数据流、大量用户以及遍布全国的基础设施。
在旧有模式当中,“远程”机制是指用户能够以登录方式通过网络访问与自身所在位置相距甚远的集中资源。现在,需要对CERN数据(或者天文数据)进行处理的研究人员希望能够从来源处获取数据,将其移动至应用当中,运行该款应用,获取结果并共享结果等等。
“为了实现网络设备商用化,供应商需要提供低成本交换机,同时将其全部集成至单一SDN控制面板当中,从而实际成本节约,”他表示,但在NCI看来,SDN的重要性已经远远高于上述作法带来的复杂难题。
“对于我们来说,真正的成本优势在于能够跨越多套国家级设施实现灵活性目标。”
SDN控制面板的存在,意味着NCI的用户们不再需要以某种方式借助电信运营商的力量,他表示:“我们可以为研究人员建立复杂的内部网络,其负责以透明方式跨AARnet实现数据传输,而无需触及运营商控制面板。”
AARnet对SDN功能的支持能力非常重要,因为研究人员所使用的网络容量将直接转化为应用程序功能——这种关系与上世纪九十年代的方案非常相似:“十五年之前,那时候人们还在使用ISDN PRI或者ATM(即初级速率接口与异步传输模式)。大家可以拨号上网并直接使用资源。”
“事实证明,这确定是一种极具成本效益的软件实现方式。”
如今的体系构建工作再次回归十年前的思路,“大部分资源由云环境提供”,而OpenStack则在NCI用于承载工作负载的虚拟机体系的升级工作当中起到举足轻重的作用。
软件堆栈“仍需要时间以达到成熟”,Howard告诉我们,但OpenStack未来三年的定期升级规划已经让NCI方面有信心将其引入生产环境,而Rackspace等厂商也在配合推出相关方案——这一切都让OpenStack已经不再仅仅属于实验室环境下的“科学项目”。
尽管如此,Howard指出:“这是一整套复杂的软件集合,需要想办法将其整合起来。”虽然大家“无法在车库中实现集成并立即将其投入生产环境”,但先以小规模方式安装并摸索无疑是了解OpenStack的最佳途径,他建议称。
而对于用户来说,由技能积累带来的收益也显而易见。“无论具体使用哪种虚拟化平台,这些技能都可以稍加调整即运用于VMware等各类平台之上。”
相较于那些令人头痛的高难度环境,Howard强调称,NCI发现OpenStack一直在“致力于平衡可用功能、简化功能优势的具体实现方式以及有效培训研究人员运用环境优势”。
为了尽可能降低研究人员的上手难度,大量指标被纳入仪表板以供他们随时查看。
“最典型的实例就是虚拟基础设施即服务平台——这是一套标准的OpenStack平台,用户可以借此启动虚拟机并在此基础上构建应用程序。”
此外还有更多进阶用例,例如跨越多套设施或机构创建虚拟实验体系。在各虚拟实验室中,OpenStack能够实现多种弹性工作负载,例如在支持NCI高性能计算服务的同时运行后处理虚拟化机制。
“研究人员能够登录至门户站点,将数据拖拽至/出其设施,点击对话框并运行工作负载。我们则负责完成配置工作——我认为这绝对是种与众不同的实现方式。”
“我们能够支持大规模数据流:作为国家级科学枢纽,我们负责处理来自SKA、CERN、Copernicus以及地球传感系统的数据——其数据总量无疑极为庞大。”
“因此,我们能否取得成功完全依靠网络体系的表现。对于用户来说,我们需要为其提供真正稳定且值得信赖的高性能资源。”
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。