当前位置:文档之家› 东南大学软件学院研究生人工智能期末大作业

东南大学软件学院研究生人工智能期末大作业

研究生课程考试成绩单(试卷封面)任课教师签名:日期:注:1. 以论文或大作业为考核方式的课程必须填此表,综合考试可不填。

“简要评语”栏缺填无效。

2.任课教师填写后与试卷一起送院系研究生秘书处。

3. 学位课总评成绩以百分制计分。

一、基本技术介绍1、智能Agent(1)概念:Agent能够通过传感器感知环境,通过执行器的动作作用于环境。

在Agent的概念框架下,AI的任务就是设计和建造理性的Agent,所以人们更为关心的是理性Agent。

理性Agent对每一个可能的感知序列,根据已知的感知序列提供的证据和Agent具有的先验知识,理性Agent应该选择能使其性能度量最大化的行动。

(2)特点:从感知序列到行动的理想映射,在很多情形下有可能设计一个好的、紧凑的Agent 来实现映射。

一个真正的智能Agent在有足够时间去学习调整的条件下,应当在各种类型环境下做出成功的行动(自主性)。

(3)结构:从传感器中将感知送到程序,运行程序,并将程序的行动选择送到作用体,这样就完成了一次Agent的工作过程。

Agent、结构和程序三者间关系为:Agent=结构+程序。

(4)环境:Agent施加行动于环境中,环境反过来又为Agent提供感知。

不同的环境要求用不同的Agent程序与之对应。

(5)AI与agent:在智能 agent的概念框架下,AI的任务就是设计和建造理性的、适合不同任务和环境特征的各种agent,由此将AI领域的各部分内容加以组织使它们有机联系在一起2、基于知识的Agent(1)概念:智能获得不是靠反射机制而是对知识的内部表示进行操作的推理过程,在AI的世界里,这种智能方法体现在基于知识的Agent上。

用逻辑作为支持基于知识的Agent的一类通用表示。

基于知识的Agent的核心部件是知识库,知识库是一个语句集合。

这些语句用知识表示语言表达。

(2)基于知识的Agent的程序概述:基于知识的Agent用感知信息作为输入,返回一个行动。

Agent维护一个知识库KB,该知识库在初始化时就包括了一些背景知识。

每次调用Agent程序,做三件事。

首先,Agent告诉(TELL)知识库它感知到的内容。

然后询问(ASK)知识库应该执行什么行动。

在恢复该查询的过程中,可能要对关于世界的当前状态、可能行动序列的执行结果进行大量推理。

最后,Agent程序用TELL告诉知识库它所选择的行动,并执行该行动。

3、学习Agent(1)概念:Agent任何部件的性能都可通过从数据中进行学习,进而改进执行未来任务时的性能。

改进及其改进所用的技术依赖于四个主要因素:要改进哪一个部件、Agent具备什么样的预备知识、数据和部件使用什么样的表示法、对学习可用的反馈是什么。

(2)学习的反馈:在无监督学习中,在不提供显示反馈的情况下,Agent学习输入中的模式,最常见的无监督学习任务是聚类。

在强化学习中,Agent在强化序列(奖赏和惩罚组合的序列)中学习。

在监督学习中,Agent观察某些“输入—输出”对,学习从输入到输出的映射函数。

4、一阶逻辑(1)概念:一阶逻辑是一种形式推理的逻辑系统,是一种抽象推理的符号工具。

功能就是将自然事物给符号化以为体系的确立奠定语言基础。

(2)命题逻辑与一阶逻辑:一阶逻辑表示语言,它比命题逻辑表达能力更强。

在命题逻辑中,研究的基本单位是简单命题,对简单命题不再进行分解,并且不考虑命题之间的内在联系和数量关系。

为了克服命题逻辑的局限性,将简单命题再细分,分析出个体词、谓词和量词,以期达到表达出个体与总体的内在联系和数量关系。

(3)模型:一阶逻辑的模型包括对象集及其解释,解释将常量符号映射到对象、谓词符号映射到对象之间的关系、函词映射到对象上的函数。

(4)一阶逻辑的知识工程:用一阶逻辑开发知识库是一个细致的过程,包括对领域进行分析、选定词汇表、对推理结论必不可少的公理进行编码。

5、知识图谱(1)发展:知识图谱由早期的语义网络发展而来,语义网络由相互连接的节点和边组成,节点表示概念或者对象,边表示他们之间的关系。

在表现形式上,语义网络和知识图谱相似,但语义网络更侧重于描述概念与概念之间的关系,而知识图谱则更偏重于描述实体之间的关联。

(2)概念:知识图谱主要目标是用来描述真实世界中存在的各种实体和概念,以及他们之间的强关系,我们用关系去描述两个实体之间的关联。

(3)知识图谱的本质:Web视角:像建立文本之间的超链接一样,建立数据之间的语义链接,并支持语义搜索NLP视角:怎样从文本中抽取语义和结构化数据KR视角:怎样利用计算机符号来表示和处理知识AI视角:怎样利用知识库开辅助理解人的语言DB视角:用图的方式去存储知识(4)应用:知识图谱的应用主要集中在搜索与推荐领域。

在语义搜索这一块,知识图谱的搜索不同于常规的搜索,常规的搜索是根据keyword找到对应的网页集合,然后通过page rank等算法去给网页集合内的网页进行排名,然后展示给用户;基于知识图谱的搜索是在已有的图谱知识库中遍历知识,然后将查询到的知识返回给用户,通常如果路径正确,查询出来的知识只有1个或几个,相当精准。

问答系统这一块,系统同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析,进而将其转化成结构化形式的查询语句,然后在知识图谱中查询答案。

6、人工神经网络及深度学习(1)人工神经网络:从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。

神经网络是一种运算模型,由大量的节点之间相互联接构成。

每个节点代表一种特定的输出函数,称为激活函数。

每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。

网络的输出则依网络的连接方式,权重值和激活函数的不同而不同。

而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。

(2)深度学习:源于人工神经网络的研究。

含多隐层的多层感知器就是一种深度学习结构。

深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。

深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。

7、决策树(1)概念:决策树是一种基本的分类与回归方法(此处以分类为例),它可以认为是定义在特征空间与类空间的条件概率分布,决策树思想,实际上就是寻找最纯净的划分方法。

(2)模型对比:决策树模型不同于线性模型,线性模型是所有特征赋予不同的权值相加得到结果,而决策树则是单个特征进行处理,每一步寻找一个最优特征进行划分。

决策树与逻辑回归的不同之处也在于此,逻辑回归是根据所有特征求出概率,然后与某一阈值进行比较从而分类,而决策树每一步是通过最优特征进行划分,直到叶节点。

(3)学习过程:决策树的学习过程主要包括3个步骤:特征选择、决策树的生成和决策树的剪枝。

8、贝叶斯网络(1)概念:贝叶斯网络(Bayesian Networks)是描述数据变量之间依赖关系的一种图形模式,是一种用来进行推理的模型。

贝叶斯网络为人们提供了一种方便的框架结构来表示因果关系,这使得不确定性推理变得在逻辑上更为清晰、可理解性强。

(2)本质:首先贝叶斯网表达了各个节点间的条件独立关系,我们可以直观的从贝叶斯网当中得出属性间的条件独立以及依赖关系;另外可以认为贝叶斯网用另一种形式表示出了事件的联合概率分布,根据贝叶斯网的网络结构以及条件概率表(CPT)我们可以快速得到每个基本事件(所有属性值的一个组合)的概率。

贝叶斯学习理论利用先验知识和样本数据来获得对未知样本的估计,而概率(包括联合概率和条件概率)是先验信息和样本数据信息在贝叶斯学习理论当中的表现形式。

9、遗传算法(1)概念:遗传算法是模仿生物遗传学和自然选择机理,通过人工方式所构造的一类优化搜索算法,是对生物进化过程进行的一种数学仿真,是进化计算的最重要的形式。

(2)基本思想:将竞争机制引进系统,以便不断改进和完善系统的工作性能,使系统具有自适应性。

知识更新具有随机性,系统知识的演变是不确定的,通过作各种随机的改动,然后将改动的结果应用于解题,保留成功的,抛弃失败的。

10、粒子群算法(1)概念:粒子群优化算法( Particle Swarm Optimization,PSO)是进化计算的一个分支,是一种模拟自然界的生物活动的随机搜索算法。

PSO模拟了自然界鸟群捕食和鱼群捕食的过程。

通过群体中的协作寻找到问题的全局最优解。

(2)基本思想:PSO中,每个优化问题的解都是搜索空间中的一只鸟。

我们称之为“粒子”。

所有的粒子都有一个由被优化的函数决定的适应值,每个粒子还有一个速度决定他们飞翔的方向和距离。

然后粒子们就追随当前的最优粒子在解空间中搜索。

二、应用部分行人安全过街智能系统1、应用场景随着城市化发展进程不断的加快,我国居民机动车辆日趋增多,城市道路的压力也随之增大,城市交叉口人车抢道问题日益突出。

人行横道是我国最常见的路段过街设施,也是城市交通中常见的事故黑点。

据统计,我国与行人直接相关的交通事故约占总交通事故1/3 左右,涉及行人的交通事故死亡人数约占交通事故总死亡人数的25%左右[1]。

行人过街设施的不健全、行人过街行为的不规范等原因也加剧了这一现象。

然而路段行人交通信号灯多是在保障机动车交通流畅通行的基础上设置的,不合理的行人过街信号配时造成“闯红灯”、“抢绿尾”等交通行为,严重扰乱交通秩序,降低了行人过街的安全性。

本文从行人过街特性和行人违章案例分析出发,梳理近年来出现的为保障行人过街或治理行人闯红灯而开发的智能控制系统,并提高智能化,基于感应控制的理念[2],提出一种基于感应控制的行人安全过街智能系统。

2、意义针对行人因过街等待时间过长而引发行人强行穿越的违章现象,分析了现有信号配时诱致此现象频发的主要原因,并致力于规避现有信号配时的弊端[3]。

通过实施行人安全过街智能系统,能够大大缓解交通运行的压力,提高行人以及车辆的出行效率,有效降低事故发生概率。

无论是对公共基础设施的优化、人的生命安全,还是对智慧城市的建设都具有深远的意义。

3、具体技术方案(1)总体思想本系统将采用感应控制、人脸识别的技术来规范行人过街,降低交通事故发生率。

系统将根据行人数量来判定是否需要放行。

根据过街人群的参数,采用HCM公式得出过街时间。

(2)方案系统总体设计以感应控制为主,辅以自适应控制和人工请求控制,流程如图1所示。

图1 系统整体流程图(不考虑高低峰情况)①行人相位开始,系统给定最小绿灯时间Gmin②判断在最小绿灯时间Gmin结束后,是否有后续行人请求过街。

若有,则放行单位间隔时间,若无,则进入④。

相关主题