人形机器人技术正成为科技界最炙手可热的领域,全球涌现数十家初创企业,吸引着数十亿美元的新投资。但投资者仍在寻找完美的应用场景,也就是机器人技术的进步能够契合更广泛市场的经济需求的领域。
IEEE高级会员Ayanna Howard表示:“这中间存在很大的差距,当我考虑机器人的可部署性时,我也会考虑成本问题。”
Howard是在《华尔街日报》的《Bold Names》播客节目中发表上述言论的。节目主持人兼科技专栏作家Christopher Mims指出,“在美国,一些对人工智能未来发展做决策的最具影响力的人物都愿意倾听Howard的见解。”
这是一场引人入胜且内容广泛的讨论,涉及该领域的重大进展、机器人技术与生成式人工智能的融合,以及当前该技术的局限性,包括缺乏支持机器人广泛部署的数字基础设施等问题。
Howard说:“如果你在虚拟环境中与人工智能相连,而网络带宽又不给力,那你只需等上几秒,答案就会出来。但在机器人领域,如果丢失了一秒钟的信息,就可能导致机器人摔倒或者伤到别人。所以我认为,我们面临这样一个脱节的问题:我们是否拥有能在不到一毫秒、甚至纳秒的时间内完成操作且不丢失任何连接的基础设施呢?我们目前还没有真正解决这个问题。”
好文章,需要你的鼓励
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
Meta为Facebook和Instagram推出全新AI翻译工具,可实时将用户生成内容转换为其他语言。该功能在2024年Meta Connect大会上宣布,旨在打破语言壁垒,让视频和短视频内容触达更广泛的国际受众。目前支持英语和西班牙语互译,后续将增加更多语言。创作者还可使用AI唇形同步功能,创造无缝的口型匹配效果,并可通过创作者控制面板随时关闭该功能。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。