人工智能研究报告

发布日期:2016-12-21


1.发展历史


图1 人工智能发展历史

人工智能的孕育期大致可以认为是在1956年以前。这一时期主要对人工智能的理论以及可行性进行研究论证。主要成就是数理逻辑、控制论、信息论、神经计算和电子计算机等学科的建立和发展。

人工智能概念的提出是1956年在美国达特茅斯大学召开的两个月的学术研讨会,标志着人工智能正式作为一门学科出现在世界历史的舞台上。

在当时的研究环境下,人们对于人工智能寄予了相当高的期望。1958年,卡梅隆大学的西蒙曾预言,不出10年,计算机将成为国际象棋比赛的冠军,但是这一语言直到40年后的1997年才成为现实。麻省理工学院的一位权威教授也在60年代说到“今年夏天,我们将开法出电子眼。”然而直到今日,仍然没有通用的计算机视觉系统可以很好的理解动态变化的场景。70年代,很多人相信大量的机器人很快将从工厂进入家庭。可是直到今天,家庭服务机器人的概念才逐渐明朗。

人们曾经以为只要用一部字典和一些语法知识就可以很快的解决自然语言之间的互译问题,结果发现并不简单。人类翻译时首先理解句子的意思,而机器依靠快速检索、排列次序等方法进行翻译,无法做到对句子意思的首先理解。1966年,美国国家研究委员会一份顾问委员会的报告指出“还不存在通用的科学文本机器翻译,也没有很近的实现前景。”报告一出,所有的美国政府资助的学术型翻译项目都被取消。

到了上世纪70年代,斯坦福大学的费根鲍姆相继成功合作开发出化学专家系统DENDRAL以及医疗专家系统MYCIN。随后,许多著名的专家系统研发成功。其中较具有代表性的有探矿专家系统PROSPECTOR、青光眼诊断治疗专家系统CASNET、钻井数据分析专家系统ELAS等。20世纪80年代,专家系统的开发趋于商品化,创造了巨大的经济价值。

然而到了80年代晚期,战略计算促进会大幅削减对AI的资助。DARPA的新任领导认为AI并非“下一个浪潮”,拨款将倾向于那些看起来更容易出成果的项目。人工智能再次跌入了寒冬。

20世纪90年代,随着计算机网络,计算机通信等技术的发展,人工智能的研究也逐渐走出了寒冬。1997年5月11日,深蓝计算机系统战胜国际象棋世界冠军卡斯帕罗夫,这一里程碑式的事件注定会载入史册。也宣告了人工智能再一次走入了人们的视线。随着神经网络算法的完善,深度学习算法的突破以及计算机硬件系统的飞速发展,至2013年,语音和视觉识别成功率超过99%及95%。一个由人工智能谱写的未来已经加速来临。

2.人脑的运行方式

人工智能,从本质上而言是对人脑的运行进行仿照和学习。所以对人脑的研究成果会很大程度上影响人工智能的发展趋势和路径选择。研究人工智能,首先要从研究人脑开始。新皮质是人脑进行思考和认知的主要部位,帮助人类形成概念层级。人类的认知是通过模式识别的方式进行的,从而使得人类的思维有连贯记忆,触发联想,层级嵌套的特点。

2.1 人脑结构与新皮质

大脑分为左右两个半球,前后分别有额叶,顶叶,颞叶和视叶。大脑的下边是小脑,像两个羊毛团。大脑里有脑桥和髓质,他们是由脑干,脑丘,下视丘,海马体和胼胝体构成。在大脑和小脑外部,具有很薄的灰色表层,也称灰质,也就是我们所说的大脑皮质。

图2 人脑的功能区域

人类大脑中负责以分层方式处理信息的功能区域是新皮质。没有新皮质的动物(主要是非哺乳动物)基本上无法理解层级体系。能够理解和改变现实社会的内在层级性是哺乳动物独有的特征。

在对大脑新皮质的研究中发现,其基础结构的一致性超乎寻找。现阶段学界普遍接受的假定是存在“皮质柱”作为新皮质的基本单位。在人工智能领域,把“皮质柱”视作模式识别器。大脑新皮质大约是有3亿个模式识别器组成。正是依靠这些模式识别器,人类发展出了口头语言,书面语言,工具等等。

在模式识别的信息处理方式下,大脑形成认知的是从零散的细节逐步进行整合从而形成一个完整的认知的过程。比如,对于一个“西瓜”的认知是由“圆的”,“绿色”,“有条纹”,“质量大”等等一系列细节在皮质层中一层一层上传、组合,最后形成“这是一个西瓜”的认知。所以这样的模式决定了我们的记忆过程并不是对每一件事情进行单独记忆,并非是计算机存储一张图片,一个视频的过程,而是在大脑中分散各个角落的细节组合的方式,神经网络算法便是基于这样的认识。这也是人工智能在初期快速发展之后很快衰落,直到知识工程和神经网络的兴起才使得人工智能真正步入发展高峰的原因。

2.2 大脑的思维特点

新皮质的存在带给了人类模式识别的认知方式,而与之而来的思维特点有连贯记忆,触发联想以及层级嵌套的特点。

2.2.1 连贯记忆

也许每个人很小就可以背诵字母表,然而除非按照倒序的顺序学习过字母表,否则基本做不到将字母表倒背。按理来说,倒背和顺背字母表都只是背诵而已,难度相同,然而我们却做不到倒背。

我们如果将字母表按顺序写下来,再倒序念出来肯定轻而易举。因为此时我们用到了很早以前人类就发明的工具——书面语,以此来弥补人类独立思考时的缺陷。

尝试回想一下今天在路上的所见,路上擦肩而过的人长什么样子,花坛的花是什么颜色?如果不去刻意记忆,这些我们所见过的景象很难重新回想起来。这也就说明了我们的大脑并不存储图片、视频或者音频之类的内容,我们的记忆是一种有序的图像记忆,未能图像化的部分会从记忆里慢慢淡去。

由于连贯记忆的存在,使得我们对于事物的认知能够有预测性。比如,我们对于某些扭曲或者残缺的图片仍旧能认知出图片本身。哈哈镜就是一个很好的例子。我们不断的对事态进行判断,并设想我们将会有怎样的体验,这种期望会影响我们对事物的实际感知。所以预测未来就是我们大脑存在的一个重要理由。

2.2.2 触发联想

想一想我们经常会有这样的体验,在发生某件事,看到某个图像或者听到某个声音,我们会突然回忆起过去曾经经历过的事情,并且思路清晰。然而在平时,即便刻意去找寻这件事情的相关线索也并不一定能够清晰的回忆起事件的全貌。又比如,我们可能会因为天上的一朵云的形状想到曾经在动物园骑马的经历。这种关联是一种模糊的关联形式,有时可能根本没有关联。这是人脑运行中的另一个特点,触发联想。

触发联想是信息分布式并行信息处理的一个特征,也是神经网络算法的基本模型。

2.2.3 层级嵌套

在日常生活中,我们会发现我们对于任务的完成处理是按照一定的层级结构来进行的。比如,早晨起床我们需要经过起床,刷牙,洗脸,吃饭几个大步骤,在每个大步骤中我们会有起床的流程,刷牙的流程等小步骤的嵌套。而每个小步骤内会有一些更小的步骤的嵌套。每个小步骤的触发都是因为大步骤的进行而来。比如如果今天穿的是没有扣子的衣服,那就在穿衣服的步骤内不会触发扣扣子的小嵌套步骤。

以上三个特点对于人工智能的研究和应用来说至关重要,现阶段人工智能的底层算法基本都是基于以上三个特点出发对人脑进行模拟。

3.人工智能的研究内容

从学科的角度讲,人工智能是一门新兴的边缘学科,是自然科学和社会科学的交叉学科。而其最终的应用目标则是满足类人行为的思考和判断。

图3 人工智能的研究和应用

在具体的研究细分领域,人工智能的基本研究方向主要分为认知建模、知识表示,自动推理,机器学习四个方面。

3.1 认知建模

建立人类认知模型的技术被称为认知建模,目的是从某些方面探索和研究人的思维机制,特别是人的信息处理机制。尽管计算机在处理信息方面与人有着本质的差别,但是通过对人思维方式的研究,可以为计算机智能提供思路。

3.2 知识表示

人类的智能体现在对知识的获得以及运用,可以说,知识是智能的基础。人类通过实践,认识到客观世界的规律。通过加工整理,挑选改造而形成知识,从而加以运用。为了使机器具有智能,可以模拟人类的行为,那么需要机器对知识进行适当形式的表示。知识表示是人工智能十分重要的一个研究领域。

3.3 自动推理

由几个已知的事实通过一定的逻辑演绎而得到的结论成为推理。这是对知识的使用,是事物客观联系在意识中的体现。按照结论推出的途径来分,推理可以分为演绎推理、归纳推理和反绎推理。演绎推理是一种从一般到个别的推理过程,目前研制成功的智能系统中,大多数系统均采用演绎推理。与演绎推理相反,归纳推理是一种从个别到一般的推理过程,也是人类思维活动中最基本,最常用的一种推理形式。按推理过程中推出的结论是否单调,推理又可分为单调推理和非单调推理。单调推理的意思是推理得出的结论随着推理的进行而严格增加,新的命题可以加入系统,新的定义可以被证明,同时不会对已得到的结论产生影响。本质上讲,人类的推理过程是非单调的,在不断接受新的命题和结论的同时,有可能会推翻已经得到的结论。由此,非单调推理是人工智能研究中自动推理方面重要的研究方向之一。

现实生活中存在着大量的不确定问题。不确定性主要来自于人类主观意识和客观事实的差异。事物发生的随机性,人类知识的不完全,不精确,不一致;自然语言语义模糊以及歧义等等都是不确定性产生的源泉。而针对不同的不确定性起因,人们提出了不同的理论和推理方法来解决。比如贝叶斯理论,模糊理论等等。

3.4 机器学习

机器学习是研究计算机模拟人类的学习行为,以获取新知识和技能。为了达到人类水平的人工智能,机器学习是不可避免的发展路径,也是当前人工智能领域研究和实际应用非常活跃的领域。

主流的机器学习方法有归纳学习、类比学习、分析学习、强化学习、遗传算法和连接学习等。2006年,深度学习被提出。由于其强大的学习能力以及对人脑神经网络的模仿程度,一经提出便受到了追捧。2016年3月Deep mind开发的Alphago机器人以大比分击败围棋世界冠军李世石,正式宣告人工智能接管历史上人类开发的所有智力游戏。在图像识别,语音识别等方面,深度学习的提出极大的加快了研究进度。

4.人工智能的主要学派

人工智能在发展的过程中,由于人们对其本质的理解不同,从而形成了多种不同的研究路径。目前在人工智能领域主要有符号主义,连接主义和行为主义三种学派。符号主义以物理符号系统假设和有限合理性原理为基础;连接主义以人工神经网络模型为核心;行为主义侧重研究感知-行动的反应机制。三种学派分别代表了抽象思维,形象思维,感知思维三个方面。

4.1 符号主义

符号主义学派,也成为了功能模拟学派。主要观点认为智能活动的基础是物理符号系统,思维过程可以理解为符号的运算和传递过程。核心假设是无论是人还是计算机,必须通过在符号结构上的计算来获得智能。

以符号主义观点来看,认知的过程就是处理符号,推理可以采用某种形式化的语言来进行描述。符号主义主张用逻辑的方法来为人工智能建立体系。然而,符号主义在面对“常识”以及不确定性表述方面束手无策。由此,受到其他学派的批评。

符号主义的观点被称为“经典的人工智能”,其主张用“认知”和“逻辑”的形式化的描述来解释客观世界。

4.2 连接主义

连接主义是基于神经元和神经网络的连接机制和学习算法的人工智能学派。其主要观点认为:大脑是一切智能活动的基础,因为从大脑神经元及其连接机制处罚进行研究,通过搞清楚大脑处理信息的过程和机理来揭示人工智能的奥秘,从而在机器上实现人工智能。

该学派的主要特征为:以分布式的方式储存信息,以并行的方式对信息进行处理,具有自组织、自学习的能力,适合于模拟人的形象思维,从而快速得到一个近似解。然而,这种方法的缺陷在于很难模仿人类的逻辑思维,已有的模型和算法也存在一定的问题。

应该说,连接主义的发展是与神经网络的起伏息息相关。如今在图像处理,模式识别等领域,连接主义正发挥着强大的力量。

4.3 行为主义

行为主义认为智能的基础是“感知-行动”的反应机制。其基于智能控制系统理论来研究拟人的智能控制行为。布鲁克斯在1991年提出无需知识表示的智能和无需推理的智能。他认为智能知识在与环境交互作用中表现出来,不应采用集中式的模式。而是需要不同的行为模块与环境交互,以此来产生复杂的行为。即,任何基于符号的表达方式都不能完美的表述客观世界的真实概念。

布鲁克斯的理论可以说是心理学在人工智能中的体现,他为人工智能的研究开辟了一条新路径。

5.人工智能的应用

5.1 专家系统

专家系统是一类具有专门知识和经验的计算机智能程序系统,通过对人类专家解答问题的建模,采用知识表示和知识推理技术来模拟通常有人类专家解决的问题。简单而言,专家系统即为:

专家系统=知识库+推理机

专家系统强调知识,而非方法。20世纪80年代以来,在知识工程的推动下,涌现出了不少专家系统开发工具,如:EMYCIN、CLIPS、G2、KEE、OKPS等。

5.2 数据挖掘

数据挖掘的意义在于满足人们从大量数据中挖掘出隐含的、未知的、有潜在价值的信息和知识。目前,数据挖掘在市场营销、银行、制造业、保险业等领域已经有许多成功案例。目前具有代表性的数据挖掘工具或平台有美国SAS公司的SAS Enterprise Miner、IBM公司的Intelligent Miner、中科院计算技术要就所智能信息处理重点实验室开发的大数据挖掘云引擎CBDME等。

5.3 自然语言处理

自然语言处理是研究计算机通过人类熟悉的自然语言与用户进行听说读写等交流技术。如王选的汉子激光照排(两次国家科技进步一等奖),联想汉卡(国家科技进步一等奖)等。

5.4 智能机器人

智能机器人是具备一些与人或生物相似的智能能力,如感知能力、规划能力、动作能力和协同能力。具体应用方面,如工业机器人,服务机器人等。

5.5 模式识别

模式识别是对表征事物或者现象的各种信息进行处理和分析,以便对事物进行描述,辨认,分类,解释的过程。诸如图像,文字,物体形状的识别等。

5.6 分布式人工智能

研究一组分布的、松散耦合的智能体如何运用它们的知识,信息,为实现全局的目标进行协同运作,组成多智能体系统称为分布式人工智能。多智能体系统可以构成智能体的社会,群体等,具有更大的适应性和灵活性。

5.7 互联网智能

计算机的出现给人工智能的实现提供了物质基础,互联网的爆发给人工智能提供了更为广阔的发展空间。将知识表示,推理机制运用到互联网智能,将可以定制网络服务,是互联网更人性化。

5.8 博弈

博弈是人类社会和自然界普遍存在的一种现象。小到下棋打牌,大到世界战争。博弈的双方都试图使用自己的智慧获取成功或击败对方。而计算机博弈会产生庞大的搜索空间,人工智能神经网络算法的不断完善将使得计算机博弈逐渐超越人类智慧。

6.我国人工智能的研究历史及现状

6.1 我国人工智能研究历史

相对于国外,我国对于人工智能的研究起步较晚。智能模拟纳入国家计划的研究始于1978年,1984年召开了智能计算机及其系统的全国学术讨论会。1986年起把智能计算机系统、智能机器人和智能信息处理(含模式识别)等重大项目列入国家高技术研究863计划。1997年,又把智能信息处理、智能控制等项目列入了国家重大基础研究973计划。进入21世纪后,在最新制定的《国家中长期科学和技术发展规划纲要(2006年-2020年)》中,“脑科学与认知科学”已列入八大前沿科学之一。

1981年起,我国相继成立了中国人工智能学会(CAAI)、全国高校人工智能研究会、中国计算机学会人工智能与模式识别专业委员会、中国自动化学会模式识别与机器智能产业智能控制专业委员会以及中国智能自动化专业委员会等学术团体。1989年首次召开了中国人工智能联合会议(CJCAI)。1987年创刊了《模式识别与人工智能》杂志。2006年创刊了《智能系统学报》和《智能技术》杂志。2011年创刊了《International Journal ofIntelligence Science》国际刊物。

中国科技工作者已在人工智能领域取得了具有国际领先水平的创造性成果。其中,吴文俊院士关于几何定理证明的“吴氏方法”在国际上产生了重大影响,荣获2001年国家科学技术最高奖励。

6.2 人工智能的发展现状

谷歌2014年收购Deep Mind,大力布局人工智能,而AlphaGo与李世石的时代大战也使得谷歌人工智能一战成名。微软布局全球七大研究院,研究涵盖人工智能,深度学习等。97年战胜国际象棋冠军的“深蓝”开发者IBM在全球已有十二大研究院。此外,巨头如Facebook,BAT亦在人工智能研发名录上占有一席之地。加上GPU技术的广泛应用,代码的开源将极大助力人工智能研发的深入。

60年来,人工智能经历了从爆发到寒冬再到野蛮生长的历程,伴随着人机交互、机器学习、模式识别等人工智能技术的提升,机器人与人工智能成为了这一技术时代的新趋势。

2015年被誉为智能机器人元年,习近平主席提出工业4.0“机器人革命”,李克强总理提出“万众创新”;国务院《关于积极推进“互联网+”行动的指导意见》中将人工智能列为“互联网+”11项重点推进领域之一, “十三五”规划将智能制造视作产业转型的主要抓手,在可预见的未来,人工智能必将掀起一轮新技术创新的浪潮。Gartner预测机器学习将影响深远,2020年将迎来智能大爆发,著名的未来科学家雷·库兹韦尔更预言,2030年人类将成为混合式机器人,进入进化的新阶段。

 君证资本研究员:陆超豪

返回列表页
上一篇:中国债务问题研究