当前位置：文档之家› 《人工智能》第5章学习智能体-概念学习概念学习

《人工智能》第5章学习智能体-概念学习概念学习

任何被h1划分为正例的实例都会被h2划分为正例，因此h2比h1更一般
36
假设的一般到特殊序
关系“更一般”的精确定义
任给实例x和假设h，说x满足h，当且仅当h(x)=1 令hj和hk是在X上定义的布尔函数，称hj比hk更一般，
当且仅当(xX)[(hk(x)=1)(hj(x)=1)]
记为hj more_general_than_or_equal_to hk，或hj g hk
机器人驾驶学习问题
任务T：通过视觉传感器在四车道高速公路上驾驶性能标准P：平均无差错行驶里程（差错由人类的监督裁定）训练经验E：注视人类驾驶时录制的一系列图像和驾驶指令
12
设计一个学习系统
基本设计方法和步骤
Step1: 明确任务T、性能度量P Step2: 训练经验E Step3: 选择目标函数及其表示 Step4: 选择目标函数的学习算法 Step5: 最终设计
对于集合B中的任意棋局b，V(b)定义如下
如果b是一最终的胜局，那么V(b)=100 如果b是一最终的负局，那么V(b)=-100 如果b是一最终的和局，那么V(b)=0 如果b不是最终棋局，那么V(b)=V(b’)，其中b’是从b开始双方都采取最优对弈后可达到的
终局
问题
递归定义运算效率低不可操作
引言：学习智能体
机器学习基本概念
概念学习
概念学习的定义一个例子作为搜索问题的概念学习 FIND-S 候选消除算法
25
概念学习问题的定义
什么是概念
许多机器学习涉及到从特殊训练样例中得到一般概念概念可被看作一个对象或事件集合，它是从更大的集合中选
取的子集，或在这个较大集合中定义的布尔函数
< , , , , , >
// 所有的样例都是反例
30
概念学习任务
形式化描述已知实例集X ▪ 每个实例x由6个属性描述，每个属性的取值范围已确定假设集H ▪ 每个假设h描述为6个属性的取值约束的合取（∩）目标概念c ▪ 一个布尔函数，变量为实例，即： c:x->{1,0} 训练样例集D ▪ 目标函数（或目标概念）的正例和反例求解 H中的一假设h，使对于X中任意x，h(x)=c(x)
另一方面，越有表现力的描述需要越多的训练数据，使程序能从它表示的多种假设中选择
18
Step3 选择目标函数及其表示
一个简单的表示法
对于任何给定的棋盘状态，函数V可以通过以下棋盘参数的线性组合来计算。 x1，黑子的数量 x2，红子的数量 x3，黑王的数量 x4，红王的数量 x5，被红子威胁的黑子数量 x6，被黑子威胁的红子数量
8
大纲
引言：学习智能体机器学习基本概念概念学习
9
机器学习的成功案例
学习识别人类的讲话
语音识别
学习驾驶车辆
ALVINN
学习分类新的天文结构
学习以世界级的水平对弈西洋双陆棋
TD-Gammon
通过百万次的与自己对弈来学习策略
10
什么是机器学习
什么是机器学习
计算机程序通过经验来提高某种任务处理性能的过程
把智能体放置在真实环境中而不是写出所有的规则
学习可以修正智能体的决策机制以提高性能
3
待学习的组件
智能体的组件包括
条件-行动规则世界的演变知识效用信息目标 …..
例：训练出租车司机
教官喊刹车尝试在不同的路面上刹车
6
反馈类型
监督式学习(Supervised learning)
通常要完美地学习V的可操作的形式非常困难
一般地，我们仅希望学习算法得到近似的目标函数V’，因此学习目标函数的过程常称为函数逼近
17
Step3 选择目标函数及其表示
函数的不同表示方法状态表二次多项式函数神经网络
注意
一方面，我们总希望选区一个非常有表现力的描述，以最大可能地逼近理想的目标函数
表示假设的形式（目标函数的表示）
实例的各属性约束的合取式
令每个假设为6个约束（或变量）的向量，每个约束对应一个属性可取值范围
？任意本属性可接受的值
明确指定的属性值
不接受任何值
假设的例子
<?, Cold, High, ?, ?, ?, ?>
// 所有的样例都是正例
3. 输出假设h
39
Find-S：寻找极大特殊假设
Find-S算法在例子EnjoySport上的应用
h<, , , , , > h<Sunny, Warm, Normal, Strong, Warm,
Find-S：寻找极大特殊假设
使用more_general_than偏序的搜索算法
从H中最特殊假设开始，然后在假设覆盖正例失败时将其一般化
Find-S算法 1. 将h初始化为H中最特殊假设 2. 对每个正例x
– 对h的每个属性约束ai 如果x满足ai 那么不做任何处理否则将h中ai替换为x满足的另一个更一般约束
归纳假设的一个基本假定
对于未见实例最好的假设就是与训练数据最佳拟合的假设
归纳学习假设
任一假设如果在足够大的训练样例集中很好地逼近目标函数，它也能在未见实例中很好地逼近目标函数。
33
大纲
引言：学习智能体
机器学习基本概念
概念学习
概念学习的定义一个例子作为搜索问题的概念学习 FIND-S 候选消除算法
《人工智能》第5章
学习智能体-概念学习
巢文涵
chaowenhan@ G1001/G931 北航计算机学院智能信息研究所 2020年10月25日星期日
大纲
引言：学习智能体机器学习基本概念概念学习
2
学习
学习对于未知环境是必要的
设计者缺乏全知
学习作为系统的一种构造方法是有用的
学习的定义
对于某类任务T和性能度量P，如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善，那么我们称这个计算机程序在从经验E中学习
11
学习问题的标准描述
西洋跳棋学习问题
任务T：下西洋跳棋性能标准P：比赛中击败对手的百分比训练经验E：和自己进行对弈
手写识别学习问题
任务T：识别和分类图像中的手写文字性能标准P：分类的正确率训练经验E：已知分类的手写文字数据库
子学习器可以完全控制棋局和（间接的）训练分类，就像没有施教者时
它和自己对弈进行学习一样
训练样例的分布能多好地表示实例分布
最终系统的性能P是通过后者来衡量的
15
Step3 选择目标函数及其表示
目标函数ChooseMove
ChooseMove: BM
接受合法棋局集合中的棋盘状态作为输入，并从合法走子集合中选择某个走子作为输出
训练过程
从学习器可得到的间接训练经验中导出上面的训练样例调整系数wi，最佳拟合这些训练样例
20
Step4 : 选择目标函数逼近算法
调整权值
误差平方和最小
E
(V tra (b i)n V ˆ(b )2)
b,V tra (b)i n训练样例
算法：最小均方法，LMS Least Mean Squares
目标函数
V(b)=w0+w1x1+w2x2+…+w6x6 其中，w0…w6是权值，表示不同棋局特征的相对重要性至此，问题转化为学习目标函数中的系数（即权值）
19
Step4 : 选择目标函数逼近算法
每个训练样例表示成二元对
<b，Vtrain(b)> b是棋盘状态，Vtrain(b)是训练值比如，<<x1=0,x2=0,x3=1,x4=0,x5=0,x6=0>,100>
Aldo进行水上运动的日子，表示为布尔函数EnjoySport
给定一个样例集D
每个样例表示为属性的集合
任务目的
基于某天的各属性，预测EnjoySport的值
28
概念学习任务
Example 1 2 3 4
Sky Sunny Sunny Rainy Sunny
AirTemp Warm Warm Cold Warm
34
作为搜索的概念学习
概念学习可以看作一个搜索的过程
搜索范围：假设的表示所隐含定义的整个空间搜索目标：能够最好地拟合训练样例的假设
当假设的表示形式选定后，那么就隐含地为学习算法确定了所有假设的空间
例子EnjoySport的假设空间，如果属性Sky有3种可能的值，而AirTemp、Humidity、Wind、Water和 Forecast都只有两种可能值实例空间X：包含3×2×2×2×2×2=96种不同的实例假设空间H
问题产生器
以当前的假设作为输入，输出一个新的问题，供执行系统去探索。
23
小结：设计一个学习系统
基本设计方法和步骤
Step1: 明确任务T、性能度量P Step2: 训练经验E Step3: 选择目标函数及其表示 Step4: 选择目标函数的学习算法 Step5: 最终设计
24
大纲
▪ 包含5×4×4×4×4×4=5120种语法不同的假设 ▪ 由于：包含有符号的假设将每个实例都分类为反例。因此，语义
不同的假设只有1+4×3×3×3×3×3=973个。
35
假设的一般到特殊序
假设的一般到特殊序关系
考虑下面两个假设
h1=<sunny, ?, ?, Strong, ?, ?> h2=<Sunny, ?, ?, ?, ?, ?>
概念学习问题的定义
给定一个样例集合及每个样例是否属于某个概念的标注，怎样推断出该概念的一般定义，又称从样例中逼近布尔函数
26
大纲

e商务文档

《人工智能》第5章学习智能体-概念学习概念学习

相关文档推荐：