您的位置:402cc永利手机版 > 互联网动态 > 图灵测试

图灵测试

2019-10-30 13:21

2014年6月7日是计算机科学之父阿兰·图灵(Alan Turing)逝世60周年纪念日。这一天,在英国皇家学会举行的“2014图灵测试”大会上,聊天程序“尤金·古斯特曼”(Eugene Goostman)首次“通过”了图灵测试。

2014年6月7日发生了一件事情:聊天程序“尤金·古斯特曼”(Eugene Goostman)在英国皇家学会举行的2014图灵测试大会上冒充一个13岁乌克兰男孩而骗过了33%的评委,从而按照图灵当初的定义,“通过”了图灵测试。

如果你想深入了解何为图灵测试,请看《图灵测试,测的到底是什么?》;但简单地说,这个测试的任务是让计算机程序来冒充人和人类裁判对话,如果裁判拆穿骗子的正确率不够高,就算是程序通过了。

www.402.com 1图灵测试

www.402.com 2通过图灵测试的程序“尤金·古斯特曼”。图片来源:cdn-static.zdnet.com

1950年,阿兰·图灵在那篇名垂青史的论文《计算机械与智力》的开篇说:“我建议大家考虑这个问题:‘机器能思考吗?’”但是由于我们很难精确地定义思考,所以图灵提出了他所谓的“模仿游戏”:

尤金最初在2001年由弗拉基米尔·维西罗夫(Vladimir Veselov)、谢尔盖·乌拉森(Sergey Ulasen)和尤金·杰姆琴科(Eugene Demchenko)在俄罗斯圣彼得堡共同开发,它模拟的是一个13岁乌克兰男孩。“尤金诞生于2001年。”维西罗夫介绍道:“我们当时的主要想法是,尤金能够声称自己知道所有事情,但考虑到他的年龄,他不知道所有事情也是很合理的。”“我们花了很多时间去使他具备可信的人格。今年,我们改进了尤金的‘对话控制器’,使得跟只会回答问题的程序比起来,尤金在对话中更加像人类。”

一场正常的模仿游戏有ABC三人参与,A是男性,B是女性,两人坐在房间里;C是房间外的裁判,他的任务是要判断出这两人谁是男性谁是女性。但是男方是带着任务来的:他要欺骗裁判,让裁判做出错误的判断。

www.402.com 3模拟这样一个乌克兰小孩是“公平”的吗?其实两年前Abstrusegoose就嘲笑过这种思路。图片来源:科学松鼠会

那么,图灵问:“如果一台机器取代了这个游戏里的男方的地位,会发生什么?”这台机器骗过审问者的概率会比人类男女参加时更高吗?这个问题取代了我们原本的问题:‘机器能否思考?’”而这,就是图灵测试的本体。

这届图灵测试大会由雷丁大学系统工程组织。按照大会规则,如果在一系列时长为5分钟的键盘对话中,某台计算机被误认为是人类的比例超过30%,那么这台计算机就被认为通过了图灵测试。此前,从未有任何计算机达到过这一水平。2014图灵测试大会共有5个聊天机器人参与,其中尤金成功地被33%的评委判定为人类。负责区分参赛者是人类还是计算机的评委包括了英国演员罗伯特·卢埃林(Robert Llewellyn),他曾成功发起要求政府授予图灵死后赦免状的运动。

www.402.com 4中文屋子

www.402.com 5一个人(C)询问两个他看不见的对象(正常思维的人B和机器A),对象能够理解C所用的语言。如果经过若干询问后,C无法区分A与B,则A通过图灵测试。图片来源:维基百科

图灵测试自诞生以来产生了巨大的影响力,不光有支持,也少不得批评。其中最重要的批评之一,可能是1980年约翰·塞尔在《心智、大脑和程序》一文中提到的中文屋子思想实验了。

雷丁大学的客座教授、考文垂大学副校长凯文·沃里克(Kevin Warwick)参与了大会的组织工作。“某些人会说其实图灵测试早已经被通过了,世界各地的类似赛事上都有‘图灵测试’的身影。不过,这次活动所包含的同时比较测试是史上最多的,也通过了独立认证。”他说:“至关重要的是,在这次测试中,对话是不受限制的。真正的图灵测试正是不预设问题或主题的。所以,我们很骄傲地宣布,图灵测试是在这周六才首次被通过的。”沃里克说,图灵自己在逝世前不久就曾预言图灵测试迟早会被通过。

塞尔说,想象他锁在一间屋子里,手动模拟一个巨大的AI程序,和外界进行中文的对话。这个程序据说是“懂中文”的——至少,能以中文通过图灵测试。屋子里除了一堆纸(塞尔的原话是“bits of paper”)上写着运算的规则之外,别无他物。(好吧,为了人道起见也许应当添加基本的维生设施……)

“我希望祝贺每一位曾经参与开发尤金·古斯特曼的人。我们整个团队都对此结果感到非常兴奋。”尤金的创造者维西罗夫在会后表示:“这对我们来说是项了不起的成就,我们希望能借此激发人们对人工智能与聊天机器人的兴趣。”他透露,接下来他们计划让尤金变得更加聪明,并继续致力于提高他的“对话逻辑”。

www.402.com 6直觉泵的旋钮

沃里克指出,计算机能让我们将他人甚至其他东西当做自己信任的人,这无疑在网络犯罪方面为我们敲响了警钟。图灵测试正是对抗这些威胁的重要工具。“理解这类实时在线交流如何让人们对某些事信以为真并对他们造成影响,是非常重要的事情。”沃里克说。(编辑:Ent)

这种思想实验——用丹内特的话说叫“直觉泵”——有个共同的问题。它的确给出了一个直觉的结论,但是这结论是来自一个完整的详尽的思想实验,而不像普通的逻辑推理那样来自具体而明确的几个前提。如果这个实验的某个细节,某个你觉得无足轻重的细节,欺骗了你的直觉呢?

编者的话:
​关于尤金·古斯特曼“通过”图灵测试这件事情,有几点需要说明。这事很牛,但可能没有你想象的那么牛。
1 它不是一台超级计算机,它只是一个程序,一个软件。
2 30%这个比例是图灵说的,但是无论是这个比例还是图灵测试本身,实际上都不是人工智能的完美金标准——这更接近于一种测量计算机能否思考的操作性定义。
www.402.com ,3 该程序冒充的是一个来自乌克兰、英语非母语的13岁小孩,这实际上不完全公平。
4 这个程序实际上是一套人类对话的模拟脚本,从认知角度来说,它真不大能算得上是思考……

最有名的直觉泵大概是有轨电车问题(Trolley Problem),1967年由英国哲学家费丽帕·弗特提出。铁轨上有五个小孩在玩,停用的岔轨上有一个小孩在玩,你要把车转移到岔轨上压死一个孩子救下五个吗?这是一个非常典型的关于道德问题的直觉泵。但是千万不要以为这实验就能完整地代表你的道德立场——如果我换一个条件,那个岔轨没有停用,也在正常运行,只是这趟车正好不往那走呢?如果我再换一个条件,根本就没有岔轨,那个小孩就在你身边玩,你把他推下去就能让车停下救另外五个小孩呢?如果那一个小孩是你的亲人呢?如果根本没有小孩、只有你自己决定是否要自己跳下去呢?

本文由402cc永利手机版发布于互联网动态,转载请注明出处:图灵测试

关键词: www.402.com 402cc永利手机版