Zapata量子码农:准备好了热闹的旅程。(图:Zapata)
我们在量子计算的路上前行。不过这些功能强大的量子机器却仍处于雏形原型阶段,在我们开始制造更多量子机器之前还要克服几个关键的挑战。
量子提示:“传统”计算机根据二进制的1和0进行计算,因此所有的值和数学逻辑基本上都在这两个值的基础而确定的。而量子叠加粒子(名为“量子位”)可以是1或 0或处于介于0与1之间的任何地方,量子位表达的值还可以根据从哪个角度观看量子位而不同……因此量子位的广度更大,我们也就可以创建更多的算法逻辑和计算能力。
建造量子计算机的主要挑战之一是量子计算机会产生的大量的热量。科学家一直都在研究不同的半导体材料,例如所谓的“量子点”(https://www.nanowerk.com/what_are_quantum_dots.php)就是用来帮助克服热量挑战的。基本的问题是,量子位很特殊,量子位很强大,但量子位也很脆弱……热量是量子位的死敌之一。
另一个核心挑战是噪音。
计算被我们新的超级量子机器里量子电路的“量子门”处理时会产生大量的噪声干扰(可以想象成发动机在加速时会发出更大的声响),因此这意味着我们必须定义及接受“基于NISQ的量子应用程序” 术语,NISQ是“噪声中级规模量子”的英文缩写。
理论物理学家John Preskill(https://en.wikipedia.org/wiki/John_Preskill)在2018年的一篇文章里(https://arxiv.org/pdf/1801.00862.pdf)对此做了明确地阐阐述,“噪声中级规模量子技术将在不久的将来面世。具有50-100量子位的量子计算机或许已经能够完成那些超越当今经典数字计算机功能的任务,但量子门噪声将限制能可靠地操作的量子电路的大小。量子技术人员应该继续努力研究更精确的量子门及最终实现完全容错的量子计算。”
尽管我们知道量子计算存在热量和噪音方面的挑战,但这也未能令Strangeworks、D-Wave Systems、Coldquanta等公司(还包括常见的英特尔、IBM和微软)停下在量子领域里的发展步伐。总部位于波士顿的Zapata Computing公司也加入了这个名单。Zapata公司给自己的定位是主打基于NISQ的近期量子应用程序及提供对企业团队的支持的量子软件公司。近期(https://arxiv.org/abs/1909.07344)在这里的意思其实就是“现在”,即是指那些我们可以真正在量子设备上使用的约100-300量子位的量子“材料”。
Zapata最新的量子飞跃(绝对是双关语)是名为Orquestra的抢先体验计划。Orquestra是个量子工作流平台。Zapata公司声称已经在Orquestra开始提供可与软件和硬件互操作的企业量子工具集,也就是那些我们可以在现代企业IT部门里实际使用的量子工具。
Zapata首席执行官[Christopher Savoie 表示,“用户可以用Zapata的统一量子操作环境构建、运行和分析量子及量子工作流程。该工具集令企业和机构可以在世界上留下自己的量子烙印,他们能够在今天开发量子功能及基础知识产权,同时可为明天的衍生知识产权提供支持。这是新的计算模式,是建在统一的企业框架上,框架跨越了量子、经典编程和硬件工具。我们用Orquestra可以加速规模性的量子实验。”
Zapata的Orquestra早期使用计划面向具有软件工程、机器学习、物理学、计算化学或量子信息论背景并正在解决特别复杂的难题的用户。
Orquestra可在跨软件和硬件堆栈上使用。Orquestra提供了一个可扩展的开源和由Zapata创建的组件库,用于编写、运作和优化量子电路及在量子计算机、量子模拟器和经典计算资源里运行这些量子电路。Orquestra配备了通用的工作流程系统和应用程序编程接口(API),可用于连接各种量子设备模式。
Zapata首席技术官Yudong Cao表示,“我们开发Orquestra本来是为我们的客户的扩展工作规模,后来意识到量子社区也需要Orquestra。 Orquestra是管理量子工作流的唯一系统。我们设计和部署计算解决方案的方式正在发生变化。Orquestra的互操作性可以进行跨平台算法和工作流的扩展和模块化实现,还可以做到令规模化实验 实现快速、流畅的可重复性。”
我们正处在旅途之中。是一条从经典去往量子之路。在这条道路上最好的做法是坚持使用可互操作的工具(例如Zapata提供的工具)及采取模块化和可扩展的方法。用车做类比的话,这意味着将旅程分成几小段并确保在长途旅行时备足汽油。量子软件的并行性显而易见,无需解释。
许多人认为,量子计算将来即便普及了仍只会主要以云计算的量子即服务(QaaS)软件包的形式提供给用户使用,不过在这之前了解一下嘈杂过热的主机房就算是观赏一个真的很棒的电影预告片吧。
好文章,需要你的鼓励
谷歌DeepMind研究团队开发了一种革命性的机器人3D重建技术SplatMesh,能够让机器人从不完美的真实数据中学习,同时重建物体几何形状和外观。该技术采用端到端优化策略,将机器人校准、场景重建和物理仿真统一在一个框架中,在ALOHA2双臂机器人上的实验证明其能够处理现实世界的复杂条件,为机器人自主学习和适应提供了新的解决方案。
电子科技大学研究团队突破性发现:仅使用不到10%的精选训练数据,就能让多模态AI的推理能力超越传统全数据训练方法,同时缩短40%训练时间。他们开发的RAP数据选择框架通过因果差异分析和注意力评估,精准识别能激发AI真正多模态推理的"认知样本",颠覆了"大数据必然更好"的传统观念,为AI训练开辟了质量优先的新路径。
这项由巴斯克语言技术中心团队完成的研究,开发了GUIDEX方法来自动生成信息提取的标注指南和训练数据。该方法通过四个步骤(文档总结、结构化表示、指南生成、实例提取)模拟专家工作流程,无需人工标注即可适应新领域。实验显示,GUIDEX在七个零样本命名实体识别基准上创造了新的最佳成绩,比现有方法平均提升近2个F1分数点。
Skoltech等机构联合开发了首个多语言"常青问题"识别系统EverGreenQA,能准确区分问题答案的时效性。研究创建了包含7种语言4757个问题的数据集,训练的EG-E5分类器准确率达90.6%,超越现有大型语言模型。该技术可改善AI自我认知、优化数据集质量,并能预测GPT-4o的检索行为,为构建更可信的AI问答系统提供重要突破。