2023年7月20日,北京——英特尔亮相专业视听和集成体验展会InfoComm,不仅集中展示了多款基于英特尔技术与产品组合的远程协作解决方案,还宣布将携手生态伙伴MAXHUB,打造更加智能高效的办公场景,共同赋能中国企业数字化转型。
双方合作:MAXHUB总裁李建民(左)、英特尔中国区物联网及渠道数据中心事业部总经理郭威(右)
英特尔中国区物联网及渠道数据中心事业部总经理郭威表示:“作为企业数字化协作中的重要组成部分,视频会议成为了引领企业数字化转型的排头兵。英特尔正在凭借强大的算力和全球领先的智能边缘软硬件技术,携手包括MAXHUB在内的生态伙伴,从远程视频会议到智慧协作解决方案,实现从各类会议室到桌面的全场景覆盖,从而为行业提供更智能、更高效的智慧会议及智慧办公解决方案,为更多组织实现智能化办公添砖加瓦。”
为满足企业在数字化变革中的各种需求,英特尔不仅通过高性能硬件产品及设备打造可编程的、灵活的基础设施,还借助先进的软件及 AI 解决方案提供更强大的边缘算力和推理能力以实现自动化操作。英特尔平台所具备的强劲处理能力,确保了不同终端及不同会议场景都可无缝切换流畅而统一的会议体验。即便同时打开邮件、文档、多媒体和即时通信等多个应用程序,音视频仍旧能够顺畅而不受影响。同时,英特尔平台还可支持多人、多端在线分享和编辑文档,使团队协作不受时间、空间限制,在确保远程协作效率的同时,进一步提高了企业生产力。
展会上,英特尔联合MAXHUB,着重展示了其视讯专款Pro V6、分体式视频会议终端VX50与搭载英特尔TCI透明终端架构的TCI云终端一体机等产品。其中,MAXHUB 视讯专款Pro V6搭载4800万像素+800万像素云台长焦双摄,配备制图级4K显示屏,满足本地会议和远程视频会议场景。支持 AVC 硬件视频会议,获得主流会议生态软件认证,满足专业远程协作;MAXHUB 分体式视频会议终端 VX50具备支持 4K 采集、4K编码、4K 输出的全链路超高清视频能力,最高支持8 路摄像机输入,可同时输出4组 4K超清画面,满足多功能厅、指挥中心等专业远程协作需求。
MAXHUB总裁李建民表示:“未来,MAXHUB将与英特尔继续深化合作,在OPS、人工智能、云计算、云存储和物联网等前沿技术上探索更多机遇,并在智慧办公、智能医疗等物联网相关领域加速应用与实践,共同助力智能化办公转型升级,为千行百业掀起一股‘智能协作’新浪潮。”
当前,数字化潮流逐渐渗透办公场景。英特尔深刻意识到,数字化的升级与改造是一家企业提高效率的必经之路。未来,英特尔将继续通过由无所不在的计算、无处不在的连接、从云到边缘的基础设施、人工智能、传感和感知所构成的“五大超级技术力量”与各行各业的生态伙伴携手,助力企业智能化升级,为数智化时代注入新动能。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。