Elementary Robotics 通过 NVIDIA Jetson 提高产品跟踪与质检能力,其服务客户包括丰田。
Arye Barnehama 曾是一家可穿戴计算创业公司的创始人,他深谙此类消费设备制造业的艰辛。2014 年,他移居中国深圳,亲自监督一条脑电波监测头巾 Melon的生产线。
正是这样的一次经历给他留下了制造需要自动化的深刻印象。
于是,他开始了 Elementary Robotics 的项目,这家公司为制造业开发机器人,其总部位于洛杉矶,并由帕萨迪纳的 Idealab 孵化。
Elementary Robotics 成立于 2017年,最近刚刚获得了 1,270 万美元的 A 轮融资,其中就包括来自客户丰田的投资。
Elementary Robotics 在需要跟踪数千个零部件的客户中部署。它的系统不断对算法进行培训,进化检测功能。
用于生产质检的 Jetson
Elementary Robotics 开发了自己的硬件和软件,用于制造过程中的产品质量检测。此外 Elementary Robotics 提供了一个由 Jetson 驱动的机器人,用于检查零件有无缺陷,致力于通过零部件的跟踪检测和问题发现,来提高产品质量。
要在快速移动的生产线上检测出最小的缺陷,就需要使用 AI 实时处理高分辨率相机数据。借助启用了嵌入式 CUDA 的 GPU 和 Jetson 上的 CUDA-X AI 软件,可以实现这一点。当 Jetson 平台根据视频流做出决策时,所有决策都被吸收到其云数据库中,以便客户能够查询数据。
结果以及实时视频也将发布到 Elementary Robotics Web 应用程序中,且可以从任何地方进行访问。
Elementary Robotics 的系统还使公司能够在将供应商的零件投入生产线之前对其进行检查,从而避免了代价高昂的故障。它可用于检查生产线上的装配以及在后期生产中进行质量控制。
它的应用包括对电子印刷电路板和组件,汽车零部件以及轻工业用齿轮的检查。 Elementary Robotics 的客户还将其平台用于包装和消费品,例如瓶子,帽子和商标标签。
“所有人对质量的需求一直在上升,” Barnehama 说。“我们使用 NVIDIA 系统在边缘上进行实时推理来进行检测,帮助提高产品质量。”
Jetson 平台最近在基于 SoC 的边缘设备的计算机视觉和对话 AI 用例中展示了 MLPerf AI 推理基准测试的领导地位。
Elementary Robotics 是 NVIDIA 初创加速计划的成员,它是一个可以帮助 AI 和数据科学初创公司更快推向市场的项目。
可追溯的操作
这家初创公司的支持 Jetson 的机器学习系统可以处理瞬间的异常检测,以发现生产线上的错误。当有缺陷零件退回时,Elementary Robotics 可以了解它如何发生的。其应用场景包括电子,汽车,医疗,包装消费品,物流等等。
Barnehama 说,对于制造商而言,这种可追溯的操作非常重要,公司可以回头找到并解决问题的源头,以提高产品可靠性。
“你一定希望可以胸有成竹的说,Ok 我们这里有件缺陷产品被退回了,让我查查它是什么时候做得产品检测的,我拥有所有的数据。”Barnehama 说。
企业用户,开发人员和 DIY 爱好者可以使用 NVIDIA Jetson 创建 AI 应用程序,同时学生和教育工作者也可使用 NVIDIA Jetson 学习和教授 AI。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。