扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
IBM超级计算机“沃森”近日在《危险边缘》竞赛节目中击败了该节目历史上两位最成功的两位选手肯-詹宁斯和布拉德-鲁特。继“深蓝”之后,聪明的人脑再一次败给了智慧程序。
“沃森”成功的秘诀在于拥有一套可以分析自然语言的算法,并能够分析出由该算法得出的结果是否是最佳选择。这种“自我认知”十分重要,因为“沃森”提出问题后要立即通过所有的算法进行分析,然后对结果进行排序。如果某单一结果的可信度较高,计算机就会触发一个抢答系统,完成类似于人类按下抢答按钮的操作。
“沃森”与两位人类对手在《危险边缘》竞赛节目现场
IBM也把“沃森”称为“DeepQA”,不得不提到“沃森”的前辈“深蓝”。“深蓝”在1997年战胜了国际象棋大师卡斯帕罗夫,还战胜了早期弈棋机的后代“Deep Thought”。“沃森”建立于纽约州约克城的托马斯·沃森研究中心,该建筑是由芬兰建筑大师埃罗·沙里宁于上世纪60年代所设计。
在“沃森”智慧的背后蕴含着IBM强大的技术力量。其硬件由10个机柜总共90台Power 750服务器组成,每台POWER 750服务器配备四路八核32线程3.5GHz处理器,运算速度为80 teraflops,内存16TB,数据库采用DB2,操作系统为SUSE Linux Enterprise Server,是一个总共拥有2880个POWER7核心的集群系统。
IBM POWER7处理器打造的“沃森”超级计算机
“沃森”使用的软件是建立在IBM开源的UIMA体系结构之上。UIMA是一个用于非结构化信息管理应用的平台,提供了一个可使问题处理模块独立工作的框架,能够对结果进行筛选得出最佳答案。Apache项目开发了当前的UIMA版本以及一些通用模块,而节目中使用的模块只是其中的一部分。
“沃森”具有的智慧力量很大程度上出自于IBM对数据的策划收集。参与该项目的科学家Jennifer Chu-Carroll表示,如果答案被详细保存在数据库中,“沃森”将擅长于解决可预测性的问题。
Chu-Carroll解释说,“沃森”对我们能够考虑的事实也很在行。像披头士这种填空题,给你一些选择并提问缺少的内容是什么,这对于计算机来说再简单不过了。当然这还需要理解问题的类型以及保存了相关信息资源。
她还指出,全部信息文档的建立大多是基于自然语言,包括授权的披头士歌词。“沃森”是完全独立的信息系统,在节目中也不需要接入互联网。Chu-Carroll解释说,我们依据古登堡计划获取信息资源。就像是另一个维基百科,而我们最需要的免费信息资源包括:词典、百科全书、报纸文章等,当然还包括《危险边缘》节目的主题。
不同于谷歌和其图书工程,IBM选择了遵守授权规定。Chu-Carroll表示,如果我们没有许可证,可能就没有“沃森”。IBM也没有使用任何CYC资源,CYC是一个有争议的人工智能项目,旨在把人类的知识归类到一个结构化的数据库中。“沃森”使用的大部分信息都是通过计算机搜索出来的纯文本。
Chu-Carroll表示,节目中进行抢答的搜索算法是最耗时的操作。该小组研究了往期《危险边缘》节目,对主持人Alex Trebek的阅读速度进行了计时,并估计“沃森”在抢答之前需要3秒钟的求解时间。一些观察者发现,如果题目线索很少并且阅读的很快,“沃森”往往就会没有响应。这是因为“沃森”对所有问题都分配了相同的处理时间,而没有考虑问题的长短。Chu-Carroll称,这些问题可能会在以后得到解决。
在节目进行期间,“沃森”通过算法从上百万量或教科书长度的文本中归结出可能的答案,并将前三个答案显示给观众。
Jeopardy有一种独特的题目叫daily double question。这种题随机出现,回答这种题目时,选手可以赌上一个分数,答对就能赢得这么多分,但答错就要扣同样多的分。研究人员花了很大精力来研究如何在Daily Double题目抢答前决定要赌的分值以及确定答案的可信度。Watson还对自身和对手拥有的钱数进行追踪,并以此信息来改变答题策略。这样就足以避免“pulling a Clavin”事件的发生,该事件指的是在80年代情景喜剧《Cheers》中的一个片段,当时邮递员Cliff Clavin是在"Jeopardy"的决赛中由于堵的分数过高而失去了领先位置。
“沃森”技术未来将怎样发展?IBM计划将软件商业化,解决工业中巨大知识集合的分类和搜索问题。致力于纯文本、相对未过滤文本和自然语言文本的使用,意味着系统仅通过选择一种不同的知识库就可以为新的领域进行重构。例如,以呼叫中心为例,“沃森”可能就会对产品说明和其它相关文本的庞大数据库进行搜索,以帮助找到最佳答案。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者