1.8 机器拟人心
反驳了诸多与机器可以具有思维相对立的观点的同时,图灵也正面给出机器获得思维的一种可能途径。在20世纪,人们已经对脑科学有了初步的了解,知道了人类大脑的思维是由脑皮层中大量神经元互相连接实现的。虽然从神经元具体产生智能和思维的过程尚且不明确,但如果把思维和脑科学的研究比喻成剥洋葱的话,当人们发现一些脑部的机制可以通过物理方式解释时,就把它像洋葱皮一样剥除掉,这时候又会发现一层新的秘密在里面需要剥除。一直这样下去,我们会看见一个人类科学所无法解释的“灵魂”存在?还是会发现洋葱皮最后一层里面什么都没有了,所有大脑创造智能的过程都能够用物理和化学现象来解释?世界上大至宇宙星系,小至分子、原子都遵从物理定律,这是现代科学界普遍接受的信仰,很难让人唯心地相信在人类大脑这里就会有无法使用物理定律解释的神秘现象出现,认同这点的人,也应该能认同思维的存在也必将是被物理定律所约束的。如果确实有一个或多个能够解释思维的定律或理论存在的话,就非常有可能找到能承载智慧的抽象模型,然后通过机械来实现它。
必须承认,直接设计一个对等于成年人思维的机械智能无疑是困难而复杂的,因为一个成年人的大脑,除了出生时初始的生物状态之外,他所接受的教育以及那些经历的不能称为教育的事情,都会导致他大脑中各种细节发生变化。那能否将问题简化,先尝试设计一个等同于初生婴儿大脑的机械智能呢?这个机械智能可以没有任何预置的知识,对世界的认知可以如同白纸一般,它只需要具有学习进化的能力即可。如果将这个智能定义为“学习机器(Learning Machine)”,那创造人工智能的过程就可以分解为建造一部学习机器以及对这部机器的教育过程两个部分。
1950年人工智能尚未形成一门真正的科学,碍于那时的历史局限性,图灵不可能在当时就给出一部拥有自主进化能力的学习机器的详细设计,因为其中涉及细节问题,几乎每一项都成为日后人工智能中的一门学术分支,解决这些问题所要付出的努力是当时根本无法想象的,其中部分列举如下。
● 接受外界信息的能力,如机器视觉、语音识别、语义理解等。
● 存储和使用知识的能力,如知识表示、知识工程、自动推理等。
● 改进自身的能力,如基于统计、概率、符号、连接的各类机器学习模型等。
● 反馈外界的能力,如自然语言处理、语音合成技术、运动平衡技术等。
● ……
退一步说,即使有人声称已经做出来了一台学习机器,如何保证对机器的正确教育和评估也是一个很大的问题。这台机器肯定不可能像人类的方式那样靠生活、上学这样的经历来成长进化,人们也无法在短时间内就评估出不同学习机器的效果优劣来。
对于如何教育学习机器的问题,我们可以尝试通过计算机模拟,使用遗传算法(Genetic Algorithm)来解决,把学习机器的进化和生物进化论中物竞天择的思想联系起来。将学习机器假设为一种生物,当机器有符合人类行为的正确响应时给予奖励,在发生不恰当行为时给予惩罚。获得更多奖励的机器,将会有更好的生存环境,能存活更久,更容易产生后代。每一代都在遗传上一代特征基因的基础上随机进化,在若干代进化之后所得到的族群,肯定是更符合我们所设定目标的学习机器。笔者这里通过一个简单的实验来模拟这种思想:假设有一种“生物”是由250个不同颜色、不同透明度的三角形组成,这种生物以“是否长得像蒙娜丽莎”为优胜劣汰的判定标准(逐个像素比较相似度),如果更像蒙娜丽莎的话就可以存活更久,产生更多后代(后代会继承前一代的基因基础)。从实验结果可以看到,第100万代时这种生物的样子已经进化到几乎和蒙娜丽莎的样子没有什么区别,这个甚至有可能是只能用250个透明三角形来模拟蒙娜丽莎的最优解了。
机器使用遗传算法绘制的蒙娜丽莎
图灵这篇论文中关于学习机器的描述是最早出现的计算机遗传算法思想的文献记录,使用计算机来模拟学习机器的进化在1950年肯定只能是个假想,完全不具备实践可行性的实验。但谁也没有预料到几十年后会有互联网这样的黑科技出现,从此人类在数十亿网民的共同积累下,制造出了一个无比庞大的,几乎包含了所有人类行为的知识库。学习机器是完全有可能通过这个知识库去判断哪些行为是人类行为中概率更高的。有了判定标准,学习机器也就有了学习进化的方向,这种方案的实践可能性正在慢慢变大。关于机器通过互联网学习知识从而进化出智能和意识的故事情节,近年来多次出现在科幻小说和电影之中,许多精英学者,如天体物理学家史蒂芬·霍金(Stephen Hawking,1942—2018)、人工智能学家斯图尔特·拉塞尔(Stuart Russell,1962—)也都向公众预警过存在这种可能性,虽然他们同样无法给出严谨的证据来证明或者证伪。机器进化获得智能的可能性是否会变成现实,答案恐怕只能留待时间来回答,留待未来去见证了。