Hewlett Packard Enterprise(HPE)公司本周召开了线上Discover大会。与旗下Arube部门上周举办的Atmosphere在线大会类似,本届Discover的主题为“智能边缘”。下面一起来看相关内容。
HPE公司高管们指出,边缘的本质,在于“事物发生的位置”。我对此深表赞同。如今,数据正以极其惊人的速度生成。根据估计,一旦自动驾驶成为现实,联网车辆每天将产生数十TB数据。此外,预计由5G网络加边缘“增压”技术所驱动的新型用例也将在消费者与企业级领域产生类似的数据增长。为此,企业无法单纯依靠云计算资源实现数据的关联、处理与分析,并据此采取行动。换言之,高度集中的云环境需要与高度分布的网络边缘结合起来,从而全面解锁数字化转型的终极形态。将计算资源放置在数据创建点周边不仅能够降低延迟水平,同时也将强化应用程序的响应能力,进而带来新的、更具颠覆性的应用范式。
在为期三天的大会上,HPE公司CEO Antonio Neri与HPE Aruba部门总裁Keerti Melkote都在具体阐述这一优势。Neri先生与Zenuity公司创始人在第一天的在一会议中着力讨论了自动驾驶技术。Zenuity是沃尔沃汽车公司设立的合资企业,致力于开发出能够兼顾安全性与性能表现的自动驾驶与辅助驾驶平台。HPE方面负责提供人工智能、高性能计算以及边缘基础设施,借此助力Zenuity公司的开发与验证工作。
在第二天的议程中,Melkote先生谈到了Aruba在COVID-19疫情中的响应工作。该公司为移动诊所和偏远地区的学校提供Wi-Fi停车场热点以及更加灵活、健壮且安全的平台(包括为远程办公人员提供Aruba远程接入点)。这些用例全部存在于网络边缘位置,也证明了Aruba在这一领域中的强大实力。展望未来,相信在基于位置类服务的帮助下,用户接触行为跟踪与人群密度监控将发挥重要作用,帮助我们在保持社交隔离的同时、促进民众安全返回办公环境。Aruba在几年之前已经收购Merdian公司,并借此建立起强大的合作伙伴与解决方案生态系统,这也再次让我们对Aruba的能力充满信心。
在本周的Discover大会上,HPE公司还发表了重要声明,旨在进一步巩固其在电信行业中的发展势头。为了帮助运营商及服务供应商在5G网络与电信云领域发现新的商业机遇,HPE方面宣布将推出HPE Edge Orchestrator。从宏观层面来看,这套解决方案通过应用目录的形式提供低延迟云服务,帮助运营商为客户提供多种“一键式”边缘计算解决方案。更重要的是,这些解决方案易于部署且能够在多个位置进行扩展。结合HPE之前春季发布的公告,Edge Orchestrator似乎有望成为一款重磅产品,解锁5G核心堆栈微服务集以及开放分布式基础设施管理(ODIM)平台等多种实际边缘用例,帮助5G运营商简化部署流程。对我来说,ODIM的重大吸引力,在于它能够同时管理来自多家厂商的多代蜂窝基础设施。ODIM提供的这种核心编排能力不仅有助于提高服务敏捷性,同时也将显著节约运营费用。
HPE公司对于Aruba职能的定位与运用方式给我留下了深刻印象。一般来讲,企业在完成商业收购之后,往往会消化被收购方的知识产权并削减相关人员。但HPE的作法并非如此,考虑到Melkote先生及其团队在推动HPE整体优势战略中所发挥的重大作用,甚至将Aruba收购案理解在一种“反向”合并也不为过。此外,HPE也拥有一支强大的电信业务团队,始终以运营思路看待一切技术成果。在他们的支持下,HPE积极参与到通过强大服务与解决方案组合构建未来5G网络的浪潮当中。简而言之,Discover 2020大会再次彰显了HPE公司在边缘技术领域的领导力与业务敏锐度。无论是从企业的角度出发、还是作为一家服务供应商,我都坚信HPE公司有能力也有意愿充分把握住5G优势及潜能所带来的历史性发展窗口。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。