思杰Citrix大中华区总经理于放
短期的业务连续性战略无法助力企业获得长期的成功。应对此次疫情危机,企业若是仅限于为员工提供远程的公司应用和数据接入,其实是治标不治本的。相反,思考并重塑企业的IT 战略,让劳动力能够以更具韧性的工作方式产出,将更有利于收入的持续增长,加强企业竞争力。
全球已经逐步进入后疫情时代,面对疫情的不确定性,企业的复工运营需要适应新常态。企业需要意识到,回归办公室并不意味着一切都已恢复正常。事实上,员工对于重返办公室存在着一定的焦虑。思杰Citrix近期委托OnePoll进行的一项最新调查显示,在接受调查的2000名美国员工中,有64%的人表示他们并不愿意在一个月内或者更长一段时间内返回办公室。而3%的受访者表示,疫情已经改变了他们的工作方式,他们已经不想从事全职工作。
各地的疫情虽然有所缓解,但小范围的反弹也让复工后的员工们绷紧了神经。Citrix认为,企业可以凭借技术提供一种更为灵活安全的工作模式,从而减少员工的焦虑,让他们集中精力完成工作,帮助企业在充满不确定性的新常态中继续前行。在新常态下,企业可能需要带领员工实施“办公室+远程”的混合办公模式。另外,无论企业目前在数字化转型中处于什么位置,IT部门都需要随时做好准备,一旦出现另一个干扰性事件就可以立刻支持远程工作。
除了保障物理空间的安全和防控条例的严格执行,企业也应该利用技术打造一个协作高效的数字工作空间。无论员工在哪里办公,搭建一个智能的数字办公空间将有效地减少由于工作模式转换带来的摩擦和不必要的麻烦。
以Citrix自身来说,Citrix在全球30个国家拥有50个办公室,固定员工有8300人,此外还有超过1000人的合同工。从技术的角度,Citrix的员工早已习惯使用Citrix Workspace,Citrix虚拟应用与桌面以及Citrix内容协作等解决方案组成的数字工作空间。这让Citrix在此次疫情中可以非常灵活地安排调整工作模式。无论办公室是关闭或是重新开放,员工都能够快速适应并且高效地投入工作当中。
在办公室复工的过程中,Citrix划分了四个阶段。第一阶段,首先让无法远程办公的必要人员进入办公室,比如需要实地作业的行政维保人员。第二阶段,在当地病例减少1-2周后,Citrix让10%的员工返回办公室,主要针对那些实地办公可能会比远程办公更加高效的群体,比如一些需要实地培训的新员工或者是那些需要在复杂环境排除故障的工程师等等。第三阶段,在当地病例持续减少2-3周后,让50%的员工返回办公室。第四阶段则是根据办公地疫情情况以及世卫组织的提示,实现全员复工。
针对办公室复工,Citrix基于Citrix Workspace开发了一系列微应用。其中包括员工健康情况的认证,办公区域使用情况的获取,并根据此提前预留会议室或工位,确认办公公共空间的卫生状况等等。此外Citrix也在与HPE(惠普企业)合作打造无接触式的办公空间,让员工可以利用自己的设备连接智能楼宇的物联网,从而实现对于办公空间的无接触式控制。另外,还可以通过集成视频分析平台或是智能工牌,实现办公区人流的管理,或是无接触式访客登记等功能。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。