人工智能及其应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 绪论

人工智能(AI,Artificial Intelligence)是当前科学技术中的一门前沿学科。作为计算机科学的一个分支,它的研究不仅涉及计算机科学,还涉及脑科学、神经生理学、心理学、语言学、逻辑学、认知科学、行为科学、生命科学和数学,以及信息论、控制论和系统论等许多科学领域。

1.1 人工智能的基本概念

1.1.1 人工智能的哲学思考

1. 怎样才能说机器具有了智能

1950年,英国数学家图灵(A.M.Turing)设计了一个实验,来验证计算机是否具有人的智能,即称为“图灵测验(Turing Testing)”。该实验首先让两个人和一台计算机分别处于三个不同的房间,且互相看不到。其中一个人扮演讯问者,剩余两者分别称为主体A和主体B。实验的目的就是通过讯问者向主体A和主体B讯问来确定哪一个房间的主体是计算机。实验开始时,讯问者并不知道哪一个房间的主体是计算机,三者都通过键盘和屏幕进行交流。讯问者可以提出任何形式的问题,而计算机可以设法隐瞒它的身份。这种测试重复多次,每次用不同的志愿者取代这两个人。如果全部测试之后,正确识别出计算机的次数不明显大于随机猜测50%的次数,则认为这台计算机具有了智能。也就是说,如果一台计算机的表现和反应,以及相互作用,都与有意识的人类个体一样,那么它就应该被认为是有意识的,即具有了智能。

2. “中国屋”思想实验

20世纪80年代,美国哲学家塞尔(J.R.Searle)针对“图灵测验”,提出了“中国屋”的思想实验(Chinese Room Experiment)进行反驳。塞尔想象自己被锁在一个有两个窗口的屋子里,这两个窗口分别是I和O,其中窗口I送入纸张,窗口O送出纸张。送入的纸张上面有很复杂的记号,用于代表一定的意义。在屋子里面有一堆翻译手册,可以查到每个记号所代表的意思,从而能够获知整个纸张所代表的意义;他然后根据其意义,可以做出正确的回答,并把这些回答再翻译成记号;最后通过窗口O把写有这些记号的回答送出,而原来送入的纸张仍留在屋子里。

现在假定这些记号就是中国字。由I窗口进入的是问题,而送到O窗口的则是对这些问题的正确答案。这一情形就像计算机里面的设置,通过一堆操纵于符号的规则(程序)对由输入窗口进入的符号做出反应,并通过输出窗口给出某些符号。那么在通过“图灵测验”情况下,屋子外面说中文的人可能以为他们是在与屋子里一个懂中文的人对话。但实际上屋子里的那个人并不懂中文,只是根据符号的形式(形态)来操纵符号,机械地进行符号转换工作。

根据“中国屋”的思想实验,塞尔认为,即使计算机给出正确的答案,顺利通过了图灵测验,计算机也没有理解它所做的一切,因此也就不能体现出任何智能。这一哲学论证自提出以来,一直被认为是对人工智能最有力的批评。

3. 人类能造出比自己聪明的机器吗

当前人工智能研究的期望目标是开发出具有人类意识和能力的机器,那么它将具有与人类相似的智能,甚至可能拥有更高的智能。如果机器的智能可以短时间内达到或超过人类,那么意义就非常重大。机器能够达到的智能极限是无法预测的,但有一点可以肯定,那就是机器的智能一定会不同于人类的智能。机器和人一样都是历史进化的产物,而人的发展史是为了满足他的生理和心理需求。原则上,没有人类特性或没有生物特征,没有生死的东西是没有这种需求的。

4. 人工智能就是模拟人类的智能吗

人工智能有时就是模拟人类的智能,但并不总是,或者说,往往不是。一方面,我们可以通过观察人类在解决问题时的方式来对智能有所了解;另一方面,人工智能中的大量成果不是通过研究人或动物的活动,而是通过直接研究需要智能解决的各种问题得到的。人工智能研究者可以自由地采用人类所没有使用的方法和超出人类的计算能力。

1.1.2 人工智能的定义

人工智能这个词看起来似乎一目了然,人制造的智能,但是要给人工智能这个科学名词下一个准确的定义却很困难。

智能是个体有目的的行为、合理的思维以及有效的适应环境的综合性能力。通俗地讲,智能是个体认识客观事物和运用知识解决问题的能力。人类个体的智能是一种综合性能力,具体讲,可以包括感知和认识客观事物、客观世界以及自我的能力;通过学习取得经验和积累知识的能力;理解知识、运用知识及经验分析问题和解决问题的能力;联想、推理、判断和决策的能力;运用语言进行抽象和概括的能力;发现、发明、创造和创新的能力;实时地、迅速地和合理地应付复杂环境的能力;预测和洞察事物发展变化的能力等。特别指出智能是相对的、发展的,如果离开特定时间说智能是困难的、没有意义的。

人工智能是相对于人的自然智能而言的,即通过人工的方法和技术,研制智能机器或智能系统来模仿、延伸和扩展人的智能,实现智能行为和“机器思维”活动,解决需要人类专家才能处理的问题。人工智能是人工制品(artifact)中所涉及的智能行为。其中,智能行为包括:感知(perception)、推理(reasoning)、学习(learning)、通信(communicating)和复杂环境下的动作行为(acting)。作为一门学科,人工智能研究智能行为的计算模型,研制具有感知、推理、学习、联想和决策等思维活动的计算系统。从本质上讲,人工智能是研究怎样让计算机模仿人脑从事推理、规划、设计、思考和学习等思维活动,解决需要人类的智能才能处理的复杂问题。简单地讲,人工智能就是由计算机来表示和执行人类的智能活动。

1.1.3 人工智能的研究目标

人工智能是信息描述和信息处理的复杂过程,实现人工智能是一项艰巨的任务。尽管如此,这门学科还是引起了许多科学和技术工作者的浓厚兴趣,特别是在计算机技术飞速发展和计算机应用日益普及的情况下,许多学者认为实现人工智能的手段已经具备,人工智能已经开始走向实践。

人工智能研究的远期目标是建立信息处理的智能理论,制造智能机器。智能机器是指能够在各类环境中自主地或交互地执行各种拟人任务,与人的智力相当或相近的机器。具体地讲,这就要求使计算机能够理解人类语言,并能够进行学习和推理。人工智能研究的近期目标是解决制造智能机器或智能系统相关原理和技术问题,以实现部分智能。

现实生活中有很多人工智能的事例,如洗衣机的模糊控制功能,模仿人的感觉、思维,通过传感器判断衣物重量、布质和状态,决定洗衣粉量、水位和洗涤方式/时间。

1.2 人工智能的发展简史

人工智能学科诞生至今已有近50年的历史,这期间人工智能的发展既取得过很多重大的成果,也遭受过巨大的挫折。

1. 第一阶段——孕育期(1956年以前)

人工智能不仅与对人思维的研究直接相关,而且与许多其他学科领域关系密切。因此说到人工智能的历史,应当上溯到历史上一些伟大的科学家和思想家所做的贡献,他们为人工智能的研究积累了充分的条件和基础理论。

公元前,古希腊哲学家亚里士多德(Aristotle)建立了第一个演绎推理的公理系统,创立了古典形式逻辑。他在其著作《工具论》中,给出了形式逻辑的一些基本规律,如矛盾律、排中律,并且实际上已经提到了同一律和充足理由律,其中的“三段论”至今仍是演绎推理的基本依据。

17世纪,英国哲学家和自然科学家培根(F.Bacon)系统地提出了古典归纳推理,使之与Aristotle的演绎推理成为相辅相成的思维法则。此外,他强调了知识的重要作用,其思想对于研究人类思维过程,以及自20世纪70年代人工智能转向以知识为中心的研究都产生了重要的影响。

17世纪,德国数学家莱布尼茨(G.W.Leibniz)提出了数理逻辑的基本思想,即把形式逻辑符号化,以此基础建立一种逻辑演算,从而实现对人的思维进行运算和推理。

1642年,法国物理学家和数学家帕斯卡(B.Pascal)发明了世界上第一台会演算的机械加法机。Leibniz于1673年在这台加法机的基础上发展并制成了可进行四则运算的计算器。

1832年,英国数学家巴比奇(C.Babbage)制成可用来计算简单数学表的差分机,并提出分析机(能自动完成各种类型数字计算)的设计思想。

19世纪中叶,英国数学家布尔(G.Boole)初步实现了Leibniz的数理逻辑思想。他提出了一种崭新的代数系统——布尔代数,用符号语言描述了思维活动的基本推理法则,从而建立并发展了命题逻辑。

1879年,德国逻辑学家费雷治(G.Frege)提出用机械推理的符号表示系统,发明了谓词逻辑。

1930年,奥地利数学家歌德尔(K.Godel)证明了一阶谓词的完备性定理。1931 年,他又证明了两条不完备性定理:第一条是,任何包含初等数论的形式系统,如果它是无矛盾的,那么一定是不完备的;第二条是,如果某个形式系统是无矛盾的,那么这种无矛盾性一定不能在本系统中得到证明。其研究成果的意义在于提出了人的思维形式化和机械化的某些极限,在理论上证明了有些事情是做不到的,即形式逻辑分析不能用来解决认识中所有出现的矛盾。

1936年,英国数学家Turing提出了一种理想计算机的数学模型(图灵机),这为电子计算机的构建提供了理论根据。在1950年,他还提出了著名的“图灵测验”,给智能的标准提供了明确的定义。

1943年,美国神经生理学家麦卡洛(W.McCulloch)和数理逻辑学家匹茨(W.Pitts)提出了第一个神经元的数学模型(M-P模型),开创了神经科学研究的新时代。

1945年,美籍匈牙利数学家冯·诺伊曼(J.V.Neumann)提出了以二进制和程序存储控制为核心的通用电子数字计算机体系结构原理,奠定了现代电子计算机体系结构的基础。

1946年,美国数学家莫克利(J.W.Mauchly)和埃克特(J.P.Eckert)研制成功了世界上第一台通用电子数字计算机ENIAC(Electronic Numerical Integrator And Calculator)。

1949年,加拿大心理学家赫布(D.O.Hebb)提出了关于神经元连接强度的Hebb规则,即当相互连接的两个神经元都处于兴奋状态时,它们的连接强度将增强。Hebb学习规则为人工神经网络学习算法的研究奠定了基础。

2. 第二阶段——人工智能基础技术的研究和形成(1956—1970年)

1956年夏,美国的达特茅斯(Dartmouth)大学的麦卡锡(J.McCarthy)、哈佛大学的明斯基(M.Minsky)、IBM公司的罗彻斯特(N.Lochester)和贝尔实验室的香农(E.Shannon)四人共同发起,邀请 IBM 公司的摩尔(T.More)和塞缪尔(A.Samuel)、麻省理工学院的塞弗里奇(O.Selfridge)和门罗索夫(R.Solomonff)、卡内基 -梅隆大学的西蒙(H.Simon)和纽厄尔(A.Newell)等人参加学术讨论班,在一起共同学习和探讨用机器模拟智能的各种问题。Minsky构建的第一个神经元网络模拟器SNARC(Stochastic Neural-Analog Reinforcement Computer)、McCarthy的α-β搜索法,以及Simon和Newell的逻辑理论家程序(Logic Theorist)成为在这次研讨会上的三个亮点。经McCarthy提议,决定使用“人工智能”一词来概括这个研究方向。这次具有历史意义的会议标志着人工智能这个学科的正式诞生,McCarthy也由此被称为“人工智能之父”。

1956年,Newell和Simon等人编写的程序Logic Theorist证明了罗素(B.Russell)和怀特海(A.N.Whitehead)的数学名著《数学原理》中第二章的三十八条定理,又于1963年证明了该章中的全部五十二条定理。他们的成果使人工智能研究走上以计算机程序来模拟人类思维的道路,第一次把求解方法和问题的领域知识分离开。在相同的研究途径下,Selfridge编制了字符识别程序、Samuel研制了跳棋程序。Samuel的跳棋程序具有学习功能,在1959 和1962 年分别打败了Samuel本人和美国一个州的跳棋冠军。

1957年,Simon、Newell和肖(J.C.Shaw)合作开发了表处理语言IPL(Information Processing Language),这是历史上第一个人工智能程序设计语言。该程序设计语言的基本元素是符号,并首次引入了表处理方法。同年,罗森勃拉特(F.Rosenblatt)提出著名的感知机(Perceptron)模型,试图模拟人脑感知能力和学习能力。该模型是第一个完整的人工神经网络,也是第一次将人工神经网络研究付诸于工程实现。

1958年,美籍逻辑学家王浩在自动定理证明中取得重要的进展。他的程序在IBM-704计算机上用不到5分钟的时间证明了《数学原理》中“命题演算”的全部220条定理。1959年,王浩的改进程序用8.4 分钟证明了上述220 条定理及谓词演算的绝大部分定理。在这一年, Minsky和McCarthy在麻省理工学院创建世界上第一个人工智能实验室。

1959年,Mccarthy开发出了著名表处理语言LISP(List Processor)。LISP语言是函数式符号处理语言,其程序由一些函数子程序组成。LISP语言自发明以来广泛用于数学中符号微积分计算、定理证明、谓词演算、博弈论等领域。同年,IBM公司的格伦特尔(H.Gelernter)研制出平面几何证明程序。

1960年,Simon、Newell和Shaw又一次合作开发了通用问题求解系统GPS(General Problem Solver)。GPS是根据人在解题中的共同思维规律编制而成的,可解11 种不同类型的问题,从而使启发式程序有了更普遍的意义。

1962年,美国工程师威德罗(B.Windrow)和霍夫(E.Hoff)提出了自适应线性单元ADA-LINE(Adaptive linear element)。它可用于自适应滤波、预测和模式识别,从而掀起了人工神经网络研究的第一次高潮。

1965年,罗伯特(L.G.Roberts)编制了可以分辨积木构造的程序,开创了计算机视觉的新领域。同年,美国数理逻辑学家鲁宾逊(J.A.Robinson)提出了与传统演绎法完全不同的消解法(也称归结原理),掀起了研究计算机定理证明的又一高潮。

1968年,美国斯坦福大学教授费根鲍姆(E.Feigenbaum)主持开发出世界上第一个化学分析专家系统 DENDRAL,开创了以知识为基础的专家咨询系统研究领域。同年,奎廉(J.R.Quillian)提出了语义网络的知识表示方法,试图解决记忆的心理学模型,后来Simon等人将语义网络应用于自然语言理解方面取得了很大的成效。

1969年,Minsky出版了《感知机》一书,该书对感知机进行了深入分析,并且从数学上证明了这种简单人工神经元网络功能的局限性,即感知机只能解决一阶谓词逻辑问题,不能解决高阶谓词问题。同时,还发现有许多模式是不能用单层网络训练的,而多层网络是否可行还很值得怀疑。因此,人工神经网络的研究由此进入低潮时期,而专家系统的研究进入高潮。

3. 第三阶段——发展和实用化阶段(1971—1980年)

人工智能开始从理论走向实践,解决了一些实际问题,同时也很快就发现了一些问题,如消解法费时、下棋赢不了全国冠军、机器翻译一团糟等。此时,以Feigenbaum为首的一批年轻科学家改变了人工智能研究的战略思想,开展了以知识为基础的专家咨询系统的研究与应用。

在20世纪70年代有不少专家系统被研制开发,如麻省理工学院研制的符号数学专家系统MACSYMA和自然语言理解系统SHRDLU,诊断和治疗青光眼病的专家系统CASNET,诊断内科疾病的专家系统INTERNIST,肾脏病专家咨询系统PIP,DEC公司开发的诊断系统VAX,卡内基-梅隆大学开发的计算机配置专家系统XCON(RI)和XSEL。

1972年,肖特利夫(E.H.Shortliffe)等人开发了医学诊断专家系统MYCIN,该系统使用了产生式系统的概念框架,并以实现方法简单、有效而著称。同年,吴兹(W.Woods)研制成功了自然语言理解系统LUNAR,该系统用于查询月球地质数据,回答用户的问题,是第一个用英语与机器对话的人机接口系统。

1973年,法国马赛大学教授考尔麦劳厄(A.Colmerauer)的研究小组实现了英国伦敦大学学生柯瓦连斯基(R.Kowaiski)提出的逻辑式程序设计语言PROLOG(Programming in Logic)。

1974年,沃博斯(P.J.Werbos)在其博士论文中提出在感知机的基础上加入隐含层的学习算法,有效解决了多层网络中隐含节点的学习问题。

1975年,Minsky创立了框架理论(Frame Theory),该理论的核心是以框架的形式来表示知识。同年,美国密执根大学教授霍兰德(J.H.Holland)提出了遗传算法(GA,Genetic Algorithm),该算法用于处理多变量、非线性、不确定,甚至混沌的大搜索空间的有约束的优化问题。

1976年7月,美国的阿佩尔(K.Appel)等用三台大型计算机,用1200小时的时间,证明了四色定理。

1977年,Feigenbaum在第五届国际智能联合会议上提出“知识工程”的概念,人工智能的研究从以基于推理为主的模型转向以基于知识为主的模型。同年,休维特(C.Hewitt)在研究Concurrent Actor Model时就首次提出了具有自组织性、反应机制和同步执行能力的软件模型,这就是最初的软件Agent思想。同年,我国的吴文俊院士给出了一类平面几何问题的机械化证明理论,在计算机上证明了一大批平面几何定理。

1979年,鲍勃罗夫(D.G.Boborow)采用基于框架的设计,实现了 KRL 语言(Knowledge Representation Language)。

4. 第四阶段——知识工程与专家系统(1980年至今)

20世纪80年代,人工智能发展达到了阶段性的顶峰。1987年和1989年的世界大会均有6~7千人参加,硬件公司有上千家,LISP硬件和LISP机形成产品。同时,在专家系统及其工具越来越商品化的过程中,国际软件市场上形成了一门旨在生产和加工知识的新产业——知识产业。

1982年日本开始了“第五代计算机研制计划”,即“知识信息处理计算机系统KIPS”,其目的是使逻辑推理达到数值运算那么快。虽然此计划最终失败,但它的开展形成了一股研究人工智能的热潮。

美国物理学家霍普菲尔德(J.J.Hopfield)于1982年、1984年在美国科学院院刊发表的两篇文章,有力地推动了人工神经网络的研究,引起了研究人工神经网络的又一次热潮。1982年,他提出了一个新的人工神经网络模型——Hopfield网络模型。他在这种网络模型的研究中,首次引入了网络能量函数的概念,并给出了网络稳定性的判定依据。1984年,他又提出了网络模型实现的电子电路,为人工神经网络的工程实现指明了方向,他的研究成果开拓了人工神经网络用于联想记忆的优化计算的新途径,并为神经计算机研究奠定了基础。

1984年,希尔顿(G.Hinton)等人将模拟退火算法引入到人工神经网络中,提出了玻耳兹曼(Boltzmann)机网络模型,玻耳兹曼机网络算法为人工神经网络优化计算提供了一个有效的方法。

1986年,鲁姆尔哈特(D.E.Rumelhart)和麦克莱伦(J.L Mcclelland)重新提出了多层网络的误差反向传播算法BP(Back-Propagation)。证明了采用Sigmoid 型神经元作为隐含层神经元的BP网络具有任意非线性特性。BP网络成为广泛使用的人工神经网络,并以此为基础做了许多改进,发展了快速有效的算法。从此,人工神经网络的研究进入新的高潮。

1987年6月,第一届国际人工神经网络会议在美国召开,宣告了这一新学科的诞生。会上竟提出了“人工智能已经死亡,人工神经网络万岁”的口号。此后,各国在人工神经网络研究方面的投资逐渐增加,相关研究得到迅速发展。

1987年,美国神经计算机专家尼尔森(R.H.Nielsen)提出了对向传播神经网络(CPN, Counter Propagation Network),该网络具有分类灵活,算法简练的优点,可用于模式分类、函数逼近、统计分析和数据压缩等领域。

进入20世纪90年代,计算机的发展趋势为小型化、并行化、网络化、智能化。人工智能技术逐渐与数据库、多媒体等主流技术相结合,并融合在主流技术之中,旨在使计算机更聪明、更有效、与人更接近。

1992年,日本政府的第五代计算机研制计划宣布失败,但随后启动RWC计划(Real Wor Computing Project)。

1993 年,美国斯坦福大学教授肖汉姆(Y.Shoham)提出面向 Agent 的程序设计(AOP,Agent-Oriented Programming)。他认为,AOP是一种基于计算的社会观点的新兴程序设计风格和计算框架,其主要思想是利用Agent理论研究提出的能表示Agent性质的意识态度来直接设计Agent和对Agent编程。

1995年,瓦普尼克(V.Vapnik)提出支持向量机(SVM,Support Vector Machine)理论,它是基于统计学习理论的一种机器学习方法。

1997年,麦克昆(W.McCune)提出了定理证明系统,机器运行了8天时间,成功地证明了1930年提出的未被证明的数学难题Robbins问题,即所有的Robbins代数都是布尔代数。

1998年,在IBM的“深蓝”计算机与著名大师的国际象棋比赛中,“深蓝”战胜了卡斯帕罗夫大师,这个程序的问题搜索次数达10120步,采用α-β搜索技术,每秒能够分析2亿步走法,共记忆了60万个棋局。

随着计算机和网络技术的发展与普及,当今人工智能主攻方向体现在:

① 并行与分布式处理技术。该研究方向包括大规模并行机和机群的体系结构、并行操作系统与并行数据结构,分布式Client/Server计算模型及其处理技术,多专机系统的合作与知识共享技术等。

② 知识的获取、表示、更新和推理新机制。该研究方向包括新的知识获取方法,常识性知识的表示、更新与推理,大型知识库的组织与维护,新一代逻辑处理机制等。

③ 多功能的感知技术。该研究方向包括对语音文字、图形与图像等信号的获取、识别、压缩与转化,以及多媒体输出和虚拟现实技术等。

④ 关于Agent的研究。Agent可以理解为一个物理的实体,如机器人,它也可以理解为是一个软件系统,由一些相互作用的成分组成。这方面研究主要包括 Agent 的交互、通信和Multi-Agent体系结构等。

⑤数据挖掘。该研究方向主要是对观测到的数据集(经常是很庞大的)进行分析,目的是发现未知的、隐含的但又潜在有用的信息和知识的过程。这方面的研究主要是信息时代的需求,面对海量的信息,人类必须有一整套的信息检索和处理手段进行分析,才能够从中得到有效的知识,否则将被繁多无用的信息淹没。

人工智能从以往追求自主的系统改变为人机结合的系统,即计算机的定量与人的定性信息处理相结合。传统的人工智能研究的是基于逻辑的,深思熟虑的智能;而现代的人工智能研究的是基于直觉、顿悟、形象思维的智能。

人工智能是计算机研究中一个非常重要的领域,在20世纪40位图灵奖获得者中有6位人工智能学者。其中,Minsky 在1969 年获奖,Mccarthy 在1971 年获奖,Simon 和 Newell 在1975年获奖,Feigenbaum和雷迪(R.Reddy)在1994年获奖。

1.3 人工智能的研究途径和方法

由于人们对人工智能本质的不同理解和认识,形成了人工智能研究的多种不同的途径。在不同的研究途径下,其研究方法、学术观点和研究重点有所不同,进而形成不同的学派。这里主要介绍认知学派、逻辑学派、行为主义学派和连接主义学派。

1. 认知学派

以Minsky、Simon和Newell等人为代表,从人的思维活动出发,利用计算机进行宏观功能模拟。该学派认为认知的基元是符号,智能行为通过符号操作来实现。它以美国人Robinson提出的消解法(即归结原理)为基础,以LISP和Prolog语言为代表,着重于问题求解中的启发式搜索和推理过程。该学派在逻辑思维的模拟方面取得成功,如自动定理证明和专家系统。

1976年,Simon和Newell提出了物理符号系统假设,认为物理系统表现智能行为的充分必要条件是,它是一个物理符号系统。这样,可以把任何信息加工系统看成是一个具体的物理系统,如人的神经系统、计算机的构造系统等。所谓符号就是模式,任何一个模式只要能与其他模式相区别,它就是一个符号。例如,不同的英文字母就是不同的符号。对符号进行操作就是对符号进行比较,即找出哪几个是相同的符号,哪几个是不同的符号。物理符号系统的基本任务和功能就是辨认相同的符号和区分不同的符号。

Minsky从心理学的研究出发,认为人们在日常的认识活动中,使用了大批从以前的经验中获取并经过整理的知识,这些知识是以一种类似框架的结构记存在人脑中,由此提出了框架知识表示方法。Minsky认为人的智能,根本不存在统一的理论。1985年,他出版了《心智的社会》(The Society of Mind)一书,书中指出思维社会是由大量具有某种思维能力的单元组成的复杂社会。

2. 逻辑学派

以Mccarthy和N.J.Nillson等人为代表,主张用逻辑来研究人工智能,即用形式化的方法描述客观世界。

该学派主要观点如下:首先,智能机器必须有关于自身环境的知识;其次,通用智能机器要能陈述性地表达关于自身环境的大部分知识;再次,通用智能机器表示陈述性知识的语言至少要有一阶逻辑的表达能力。

逻辑学派在人工智能研究中,强调的是概念化知识表示、模型论语义、演绎推理等。Mccarthy主张任何事物都可以用统一的逻辑框架来表示,在常识推理中以非单调逻辑为中心。

3. 行为主义学派

以布鲁克斯(R.A.Brooks)等人为代表,认为智能行为只能在现实世界中,由系统与周围环境的交互过程中表现出来。

1991年,Brooks提出了无须知识表示的智能和无须推理的智能。他还以其观点为基础,研制了一种机器虫。该机器用一些相对独立的功能单元,分别实现避让、前进、平衡等功能,组成分层异步分布式网络。该学派对机器人的研究开创了一种新方法。

该学派的主要观点可以概括如下:首先,智能系统与环境进行交互,即从运行的环境中获取信息(感知),并通过自己的动作对环境施加影响;其次,指出智能取决于感知和行为,提出了智能行为的“感知-行为”模型,认为智能系统可以不需要知识、不需要表示、不需要推理,像人类智能一样可以逐步进化;再次,强调直觉和反馈的重要性,智能行为体现在系统与环境的交互之中,功能、结构和智能行为是不可分割的。

4. 连接主义学派

以Rumelhart、Mcclelland和Hopfield等人为代表,从人的大脑神经系统结构出发,研究非程序的、适应性的、类似大脑风格的信息处理的本质和能力,人们也称它为神经计算。这种方法一般通过人工神经网络的“自学习”获得知识,再利用知识解决问题。由于它近年来的迅速发展,大量的人工神经网络的机理、模型、算法不断地涌现出来。人工神经网络具有高度的并行分布性、很强的鲁棒性和容错性,使其在图像、声音等信息的识别和处理中广泛应用。

此外,还有知识工程学派和分布式学派。知识工程学派以Feigenbaum为代表,研究知识在人类智能中的作用和地位。分布式学派以 Hewitt 为代表,研究智能系统中知识的分布行为。

1.4 人工智能的研究与应用领域

人工智能的知识领域浩繁,很难面面俱到,但是各个领域的思想和方法有许多可以互相借鉴的地方。随着人工智能理论研究的发展和成熟,人工智能的应用领域更为宽广,应用效果更为显著。从应用的角度看,人工智能的研究主要集中在以下几个方面。

1. 专家系统

专家系统是一个具有大量专门知识与经验的程序系统。它应用人工智能技术,根据某个领域一个或多个人类专家提供的知识和经验进行推理和判断,模拟人类专家的决策过程,以解决那些需要专家决定的复杂问题。目前在许多领域,专家系统已取得显著效果。专家系统与传统计算机程序的本质区别在于,专家系统所要解决的问题一般没有算法解,并且经常要在不完全、不精确或不确定的信息基础上做出结论。它可以解决的问题一般包括解释、预测、诊断、设计、规划、监视、修理、指导和控制等。从体系结构上可分为集中式专家系统、分布式专家系统、协同式专家系统、神经网络专家系统等;从方法上可分为基于规则的专家系统、基于模型的专家系统、基于框架的专家系统等。

2. 自然语言理解

自然语言理解是研究实现人类与计算机系统之间用自然语言进行有效通信的各种理论和方法。由于目前计算机系统与人类之间的交互还只能使用严格限制的各种非自然语言,因此解决计算机系统能够理解自然语言的问题,一直是人工智能研究领域的重要研究课题之一。

实现人机间自然语言通信意味着计算机系统既能理解自然语言文本的意义,也能生成自然语言文本来表达给定的意图和思想等。而语言的理解和生成是一个极为复杂的解码和编码问题。一个能够理解自然语言的计算机系统看起来就像一个人一样,它需要有上下文知识和信息,并能用信息发生器进行推理。理解口头和书写语言的计算机系统的基础就是表示上下文知识结构的某些人工智能思想,以及根据这些知识进行推理的某些技术。

虽然在理解有限范围的自然语言对话和理解用自然语言表达的小段文章或故事方面的程序系统已有一定的进展,但要实现功能较强的理解系统仍十分困难。从目前的理论和技术现状看,它主要应用于机器翻译、自动文摘、全文检索等方面,而通用的和高质量的自然语言处理系统,仍然是较长期的努力目标。

3. 机器学习

机器学习是人工智能的一个核心研究领域,它是计算机具有智能的根本途径。学习是人类智能的主要标志和获取知识的基本手段。Simon认为:“如果一个系统能够通过执行某种过程而改进它的性能,这就是学习。”

机器学习研究的主要目标是让机器自身具有获取知识的能力,使机器能够总结经验、修正错误、发现规律、改进性能,对环境具有更强的适应能力。通常要解决如下几方面的问题:(1)选择训练经验。它包括如何选择训练经验的类型,如何控制训练样本序列,以及如何使训练样本的分布与未来测试样本的分布相似等子问题;(2)选择目标函数。所有的机器学习问题几乎都可简化为学习某个特定的目标函数的问题,因此,目标函数的学习、设计和选择是机器学习领域的关键问题;(3)选择目标函数的表示。对于一个特定的应用问题,在确定了理想的目标函数后,接下来的任务是必须从很多(甚至是无数)种表示方法中选择一种最优或近似最优的表示方法。

目前,机器学习的研究还处于初级阶段,但却是一个必须大力开展研究的阶段。只有机器学习的研究取得进展,人工智能和知识工程才会取得重大突破。

4. 自动定理证明

自动定理证明,又叫机器定理证明,它是数学和计算机科学相结合的研究课题。数学定理的证明是人类思维中演绎推理能力的重要体现。演绎推理实质上是符号运算,因此原则上可以用机械化的方法来进行。数理逻辑的建立使自动定理证明的设想有了更明确的数学形式。1965年Robinson提出了一阶谓词演算中的归结原理,这是自动定理证明的重大突破。1976年,美国的Appel等三人利用高速计算机证明了124年未能解决的“四色问题”,表明利用电子计算机有可能把人类思维领域中的演绎推理能力推进到前所未有的境界。我国数学家吴文俊在1976年年底开始研究可判定问题,即论证某类问题是否存在统一算法解。他在微型机上成功地设计了初等几何与初等微分几何中一大类问题的判定算法及相应的程序,其研究处于国际领先地位。后来,我国数学家张景中等人进一步推出了“可读性证明”的机器证明方法,再一次轰动了国际学术界。

自动定理证明的理论价值和应用范围并不局限于数学领域,许多非数值领域的任务,如医疗诊断、信息检索、规划制定和难题求解等,都可以转化成相应的定理证明问题,或者与定理证明有关的问题,所以自动定理证明的研究具有普遍意义。

5. 自动程序设计

自动程序设计是指根据给定问题的原始描述,自动生成满足要求的程序。它是软件工程和人工智能相结合的研究课题。自动程序设计主要包含程序综合和程序验证两方面内容。前者实现自动编程,即用户只需告知机器“做什么”,无须告诉“怎么做”,这后一步的工作由机器自动完成;后者是程序的自动验证,自动完成正确性的检查。

目前程序综合的基本途径主要是程序变换,即通过对给定的输入、输出条件进行逐步变换,以构成所要求的程序。程序验证是利用一个已验证过的程序系统来自动证明某一给定程序P的正确性。假设程序P的输入是x,它必须满足输入条件φx);程序的输出是z=P(x),它必须满足输出条件Φx,z)。判断程序的正确性有三种类型,即终止性、部分正确性和完全正确性。

目前在自动程序设计方面已取得一些初步的进展,尤其是程序变换技术已引起计算机科学工作者的重视。现在国外已陆续出现一些实验性的程序变换系统,如英国爱丁堡大学的程序自动变换系统POP-2和德国默森技术大学的程序变换系统CIP等。

6. 分布式人工智能

分布式人工智能是分布式计算与人工智能结合的结果。它主要研究在逻辑上或物理上分散的智能动作者如何协调其智能行为,求解单目标和多目标问题,为设计和建立大型复杂的智能系统或计算机支持协同工作提供有效途径。它所能解决的问题需要整体互动所产生的整体智能来解决。主要研究内容有分布式问题求解(DPS,Distribution Problem Solving)和多智能体系统(MAS,Multi-Agent System)。

分布式问题求解的方法是,先把问题分解成任务,再为之设计相应的任务执行系统。而MAS是由多个Agent组成的集合,通过Agent的交互来实现系统的表现。MAS主要研究多个Agent为了联合采取行动或求解问题,如何协调各自的知识、目标、策略和规划。在表达实际系统时,MAS通过各Agent间的通信、合作、互解、协调、调度、管理及控制来表达系统的结构、功能及行为特性。由于在同一个MAS中各Agent可以异构,因此Multi-Agent技术对于复杂系统具有无可比拟的表达力。它为各种实际系统提供了一种统一的模型,能够体现人类的社会智能,具有更大的灵活性和适应性,更适合开放和动态的世界环境,因而备受重视,相关研究已成为人工智能以至计算机科学和控制科学与工程的研究热点。

7. 机器人学

机器人学是机械结构学、传感技术和人工智能结合的产物。1948年美国研制成功第一代遥控机械手,17年后第一台工业机器人诞生,从此相关研究不断取得进展。机器人的发展经历了以下几个阶段:第一代为程序控制机器人,它以“示教-再现”方式,一次又一次学习后进行再现,代替人类从事笨重、繁杂与重复的劳动;第二代为自适应机器人,它配备有相应的感觉传感器,能获取作业环境的简单信息,允许操作对象的微小变化,对环境具有一定适应能力;第三代为分布式协同机器人,它装备有视觉、听觉、触觉多种类型传感器,在多个方向平台上感知多维信息,并具有较高的灵敏度,能对环境信息进行精确感知和实时分析,协同控制自己的多种行为,具有一定的自学习、自主决策和判断能力,能处理环境发生的变化,能和其他机器人进行交互。

从功能上来考虑,机器人学的研究主要涉及两个方面:一方面是模式识别,即给机器人配备视觉和触觉,使其能够识别空间景物的实体和阴影,甚至可以辨别出两幅图像的微小差别,从而完成模式识别的功能;另一方面是运动协调推理。机器人的运动协调推理是指机器人在接受外界的刺激后,驱动机器人行动的过程。

机器人学的研究促进了人工智能思想的发展,它所导致的一些技术可在人工智能研究中用来建立世界状态模型和描述世界状态变化的过程。

8. 模式识别

模式识别研究的是计算机的模式识别系统,即用计算机代替人类或帮助人类感知模式。模式通常具有实体的形式,如声音、图片、图像、语言、文字、符号、物体和景象等,可以用物理、化学及生物传感器进行具体采集和测量。但模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。人们在观察、认识事物和现象时,常常寻找它与其他事物和现象的相同与不同之处,根据使用目的进行分类、聚类和判断,人脑的这种思维能力就构成了模式识别的能力。

模式识别呈现多样性和多元化趋势,可以在不同的概念粒度上进行,其中生物特征识别成为模式识别的新高潮,包括语音识别、文字识别、图像识别、人物景象识别和手语识别等;人们还要求通过识别语种、乐种和方言来检索相关的语音信息,通过识别人种、性别和表情来检索所需要的人脸图像;通过识别指纹(掌纹)、人脸、签名、虹膜和行为姿态识别身份。普遍利用小波变换、模糊聚类、遗传算法、贝叶斯理论和支持向量机等方法进行识别对象分割、特征提取、分类、聚类和模式匹配。模式识别是一个不断发展的新科学,它的理论基础和研究范围也在不断发展。

9. 博弈

计算机博弈主要是研究下棋程序。在20世纪60年代就出现了很有名的西洋跳棋和国际象棋的程序,并达到了大师的水平。进入20世纪90年代,IBM公司以其雄厚硬件基础,支持开发后来被称之为“深蓝”的国际象棋系统,并为此开发了专用的芯片,以提高计算机的搜索速度。1996年2月,与国际象棋世界冠军卡斯帕罗夫进行了第一次比赛,经过六个回合的比赛之后,“深蓝”以2∶4告负。1997年5月,系统经过改进以后,“深蓝”又第二次与卡斯帕罗夫交锋,并最终以3.5∶2.5战胜了卡斯帕罗夫,在世界范围内引起了轰动。

博弈问题为搜索策略、机器学习等问题的研究课题提供了很好的实际背景,所发展起来的一些概念和方法对人工智能的其他问题也很有用。

10. 计算机视觉

视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断和军事等领域中各种智能系统中不可分割的一部分。计算机视觉涉及计算机科学与工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等多个领域的知识,已成为一门不同于人工智能、图像处理和模式识别等相关领域的成熟学科。计算机视觉研究的最终目标是,使计算机能够像人那样通过视觉观察和理解世界,具有自主适应环境的能力。

计算机视觉研究的任务是理解一个图像,这里的图像是利用像素所描绘的景物。其研究领域涉及图像处理、模式识别、景物分析、图像解释、光学信息处理、视频信号处理以及图像理解。这些领域可分为如下三类:第一是信号处理,即研究把一个图像转换为具有所需特征的另一个图像的方法;第二是分类,即研究如何把图像划分为预定类别。分类是从图像中抽取一组预先确定的特征值,然后根据用于多维特征空间的统计决策方法决定一个图像是否符合某一类;第三是理解,即在给定某一图像的情况下,一个图像理解程序不仅描述这个图像的本身,而且也描述该图像所描绘的景物。

计算机视觉的前沿研究领域包括实时并行处理、主动式定性视觉、动态和时变视觉、三维景物的建模与识别、实时图像压缩传输和复原、多光谱和彩色图像的处理与解释等。计算机视觉已在机器人装配、卫星图像处理、工业过程监控、飞行器跟踪和制导以及电视实况转播等领域获得极为广泛的应用。

11. 软计算

通常把人工神经网络计算、模糊计算和进化计算作为软计算的三个主要内容。一般来说,软计算多应用于缺乏足够的先验知识,只有一大堆相关的数据和记录的问题。

人工神经网络(ANN,Artificial Neural Network)是一种应用类似于大脑神经突触连接的结构进行信息处理的数学模型。在这一模型中,大量的节点之间相互连接构成网络,即“神经网络”,以达到处理信息的目的。人工神经网络模型及其学习算法试图从数学上描述人工神经网络的动力学过程,建立相应的模型;然后在该模型的基础上,对于给定的学习样本,找出一种能以较快的速度和较高的精度调整神经元间互连权值,使系统达到稳定状态,满足学习要求的算法。

模糊计算处理的是模糊集合和逻辑连接符,以描述现实世界中类似人类处理的推理问题。模糊集合包含论域中所有元素,但是具有[0,1]区间的可变隶属度值。模糊集合最初由美国加利福尼亚大学教授扎德(L.A.Zadeh)在系统理论中提出,后来又扩充并应用于专家系统中的近似计算。

进化计算是通过模拟自然界中生物进化机制进行搜索的一种算法,以遗传算法(GA,Genetic Algorithm)、进化策略等为代表。遗传算法是一种随机算法,它是模拟生物进化中“优胜劣汰”自然法则的进化过程而设计的算法。该算法模仿生物染色体中基因的选择、交叉和变异的自然进化过程,通过个体结构不断重组,形成一代代的新群体,最终收敛于近似优化解。1975年,Holland出版了《自然和人工系统中的适应性》一书,系统地阐述了遗传算法的基本理论和方法,奠定了遗传算法的理论基础。

12. 智能控制

智能控制是把人工智能技术引入控制领域,建立智能控制系统。1965 年,美籍华人科学家傅京孙首先提出把人工智能的启发式推理规则用于学习控制系统。十多年后,建立实用智能控制系统的技术逐渐成熟。1971年,傅京孙提出把人工智能与自动控制结合起来的思想。1977年,美国人萨里迪斯(G.N.Saridis)提出把人工智能、控制论和运筹学结合起来的思想。1986年,我国的蔡自兴教授提出把人工智能、控制论、信息论和运筹学结合起来的思想。根据这些思想已经研究出一些智能控制的理论和技术可以构造用于不同领域的智能控制系统。

智能控制具有两个显著的特点:首先,智能控制同时具有知识表示的非数学广义世界模型和传统数学模型混合表示的控制过程,并以知识进行推理,以启发来引导求解过程。其次,智能控制的核心在高层控制,即组织级控制。其任务在于对实际环境或过程进行组织,即决策和规划,以实现广义问题求解。

13. 智能规划

智能规划是人工智能研究领域近年来发展起来的一个热门分支。智能规划的主要思想是:对周围环境进行认识与分析,根据自己要实现的目标,对若干可供选择的动作及所提供的资源限制施行推理,综合制定出实现目标的规划。智能规划研究的主要目的是建立起高效实用的智能规划系统。该系统的主要功能可以描述为:给定问题的状态描述、对状态描述进行变换的一组操作、初始状态和目标状态。

最早的规划系统就是通用问题求解系统GPS,但它还不是真正面向规划问题而研制的智能规划系统。1969年,格林(G.Green)通过归结定理证明的方法来进行规划求解,并且设计了QA3 系统,这一系统被大多数的智能规划研究人员认为是第一个规划系统。1971 年,美国斯坦福研究所的菲克斯(R.E.Fikes)和Nilsson设计的STRIPS 系统在智能规划的研究中具有重大的意义和价值,他们的突出贡献是引入了STRIPS 操作符的概念,使规划问题求解变得明朗清晰。此后到 1977 年先后出现了 HACKER、WARPLAN、INTERPLAN、ABSTRIPS、NOAH、NONLIN 等规划系统。尽管这些以NOAH系统为代表的部分排序规划技术被证明具有完备性,即能解决所有的经典规划问题,但由于大量实际规划问题并不遵从经典规划问题的假设,所以部分排序规划技术未得到广泛的应用。为消除规划理论和实际应用间存在的差距,进入20世纪80年代中期后,规划技术研究的热点转向了开拓非经典的实际规划问题。然而,经典规划技术,尤其是部分排序规划技术仍是开发规划新技术的基础。

1.5 人工智能相关网站介绍

人工智能的理论研究和应用正处于茁壮发展阶段,紧密关注和跟踪人工智能领域的最新成果是非常重要的。下面介绍一些人工智能领域比较知名的网站以方便读者了解人工智能领域的最新动态和研究热点。如果要了解更多的网站以及文献,可以使用搜索引擎从互联网上搜索。

(1)美国人工智能协会(American Association for Artificial Intelligence)

网址:http://www.aaai.org

美国人工智能协会(AAAI)成立于1979年,是个非营利性的科学社团组织,主要致力于让机器产生智慧思考和智能行为的研究。此外,提升公众对人工智能的理解,对人工智能实践人员的教学和培训,为人工智能领域的研究者和投资者提供指导等也都是AAAI的实践内容。

(2)人工智能教育知识库(AI Education Repository)

网址:http://www.cs.cofc.edu/~manaris/ai-education-repository/index.html

该网站收录了关于人工智能教材、教学大纲和教学设计范例等方面的信息,并且提供了与人工智能相关的教育论文,各个主题的在线教程,适合课堂或实验室教学的工具软件和环境,以及方便用户相互交流人工智能教育心得与经验的虚拟空间。

(3)专家系统expertise2go网

网址:http://www.expertise2go.com

expertise2 go是个基于网络的专家系统网站,它提供了多个面向用户基于规则的专家系统实例,如在线“PC产品顾问”、汽车故障自动诊断助理、银行放贷决策助理和数据分析技术助理等。网站从介绍专家系统的基本概念、基于规则的推理、对不确定事实的表示和处理及知识引擎,到引导用户设计并创建自己的知识库。此外,该网站还提供免费的e2 gLite专家系统外壳下载,并且有在线教程,利用e2 gLite专家系统外壳用户可开发自己的专家系统。

(4)人工智能语言Visual Prolog

网址:http://www.visual-prolog.com

Visual Prolog是一种功能强大的人工智能逻辑编程语言,由Prolog开发中心设计。目前该网站提供了由Visual Prolog开发的实例演示、Visual Prolog个人版的软件下载、在线教程、知识库和常见问题解答等栏目。

(5)人工智能研究者俱乐部

网址:http://www.souwu.com/bitfarmer/default.asp

这是为人工智能研究者提供的一个适合思想交流、技术切磋和资源互享的虚拟空间。该网站内容主要由综合讨论、兴趣小组、资源共享、分类讨论和网站联盟几个模块组成,可为开展人工智能教育的教师和学生提供该领域的实时发展动态和教学参考信息。

(6)智能科学与人工智能网站

网址:http://www.intsci.ac.cn/index.html

这是中国科学院计算技术研究所智能信息处理重点实验室建立的一个综合网站。主要介绍人工智能系统、技术及智能信息处理等知识及研究进展,还提供人工智能教学课件。

(7)其他网站

IEEE计算智能协会:http://www.ewh.ieee.org

国际神经网络协会:http://www.inns.org

国际人工智能联合会:http://www.ijcai.org

欧洲人工智能联合会:http://www.eccai.org

斯里兰卡国际人工智能中心:http://www.ai.sri.com

美国伯克利大学人工智能网站:http://aima.cs.berkeley.edu/ai.html

美国加利福尼亚大学机器学习研究组:http://www.cse.ucsc.edu/research/ml/

中国人工智能网:http://www.chinaai.org

北京大学人工智能实验室:http://ailab.pku.edu.cn

小 结

本章作为人工智能的概述部分,主要介绍了人工智能的概念、研究目标和发展简史。并简要地阐述了人工智能研究的不同学派以及人工智能应用的相关领域。最后,为了方便读者进一步了解人工智能的发展动态,给出了一些常见的国内外人工智能的著名网站。

练习题

1.1 什么是人工智能?试从学科和能力两方面加以说明。

1.2 人工智能研究的基本内容是什么?

1.3 人工智能主要有哪几个研究学派?各自观点是什么?

1.4 人工智能的主要研究和应用领域是什么?

1.5 简述人工智能的发展历史。

1.6 检索人工智能研究的文献,判定下列任务现在计算机是否能够解决:

(1)打正规的乒乓球比赛。

(2)在市中心开车。

(3)在Internet上购买可用1周的杂货。

(4)参加正规的桥牌竞技比赛。

(5)发现并证明新的数学定理。

(6)在特定的法律领域提供令人满意的法律建议。

(7)从英语到中文的口语实时翻译。

(8)完成复杂的外科手术。

对于现在不可实现的任务,试着找出困难所在,并预测如果可能的话它们什么时候能被克服。