王东
Published on 2025-02-12 / 5 Visits

【AI100问(7)】什么是图灵测试?

人工智能至今没有统一的定义。为什么人工智能的定义这么难?究其根源在于什么是智能至今都无法说得清楚。

人工智能的开创者,英国计算机学家图灵很早就意识到了这一点,认为“定义很容易拘泥于词汇的常规用法,这种思路很危险”。“与其如此定义,倒不如用另一个相对清晰无误表达的问题来取代原题”。“图灵测试”正是这样一个关于人工智能的“替代问题”。

图1:艾伦·图灵

1950年,38岁的图灵发表了一篇题为“计算机与智能(Computing Machinery and Intelligence)”的论文,提出了一种判断机器是否具有智能的一种测试方法,后来被称之为“图灵测试”。

图灵测试来源于当时流行的一种男女模仿游戏,描述图灵生平的电影《模仿游戏》片名就来源于此。游戏由一男(A)一女(B)和一名测试者(C)进行;C与A、B 被隔离,通过电传打字机与A、B对话。测试者只知道二人称呼是X、Y,通过提问以及回答来判断,最终做出“X是A,Y是B”,或者“X是B,Y是A”的结论。在游戏中,A必须尽力使C判断错误,而B的任务是帮助C。也就是说,男士A要尽力模仿女士,从而让测试者C错误地将男士A判断为女士。

图2:图灵测试概念图

在论文中,图灵首先叙述了这个游戏,进而提出这样一个问题:如果让一台计算机代替游戏中的男士A,将会发生什么情况呢?也就是说,B换成一般的人类,机器A尽可能模仿人类,如果测试者C不能区分出A和B哪个是机器,哪个是人类,那么是不是就可以说这台机器具有了智能呢?图灵在论文中预测,在50年之后,计算机在这一模拟游戏中将有不输于人类,一般的提问者在5分钟提问后,能够准确鉴别“哪个是机器哪个是人类”的概率不会高于70%。也就是说,机器将有不低于30%的概率成功欺骗提问者。后来,图灵在一次BBC的广播节目中,进一步明确了这一概念,认为这一方法可有效判断机器是否具有了智能。这就是鼎鼎大名的图灵测试。事实上,与其说图灵测试是一种测试,倒不如说是一种思想实验,计算机只有达到了这样的程度,才可以说具有了智能。

图3:Eugene Goostman 对话机器人

图片来源于网络侵删

图灵测试提出来以后,很多人参加了挑战,但都没有成功。2011年,一款称为Cleverbot的对话机器人宣称通过了图灵测试,但大家知道其背后的原理是对历史对话的搜索,因而很难说具有智能(https://www.cleverbot.com/)。2014年,BBC报导一个名叫Eugene Goostman的机器程序模仿一个13岁的小男孩,在英国雷丁大学组织的一次测试中成功欺骗了33%的测试者,因而宣称通过了图灵测试。然而,这一结果的测试过程也受到了不少质疑。

现在看来,真正通过图灵测试,实现智能机器还有很长一段路要走。