当前位置:文档之家› 乐谱识别问题

乐谱识别问题

乐谱识别问题
一问题重述
从获得的信息量角度看,听觉是人类仅次于视觉的第二感觉,因而,在机器人研究领域中,机器听力成为了一个十分热门的话题。

特别是由于听力对于人的思想熏陶和感情气质的巨大作用,使人们联想到可以通过听力来训练计算机获得感情,由此必须首先能够让计算机从音乐信号中识别出喜怒哀乐等各色情感。

人的情感十分复杂,表现在音乐中更是千差万别,这使得机器识别的困难很大。

作为机器感情识别的初步研究,我们首先给出20首风格各异的曲目,分成两类,请从中提取特征,再构造分类方法,并用这些已知的分类组去衡量你的方法是否准确。

随后希望能够用你的方法对后30首未分类的曲目进行判别。

二问题假设
1.音高符号1——7在乐谱中对乐谱类型的影响一样。

2.文件的行结束标志$和乐曲终止符不是乐谱分类的因素。

3.用各乐谱符号在该乐谱的百分含量来表示对该谱的作用大小。

4.每个符号在乐谱中出现的机会是均等的即服从均匀分布。

三符号说明
x:第i首乐谱的第k种音符在乐谱i中出现的次数
ik
p:第i首乐谱的第k种音符在乐谱i中的百分含量
ik
ikA X :第i 首乐谱的第k 种音符对第1类的相对分辨率 ikB X :第i 首乐谱的第k 个音符对第2类的相对分辨率 iA X :第i 个乐谱对第1类的平均相对分辨率 iB X :第i 个乐谱对第2类的平均相对分辨率
四 问题分析
本问题在先给出前20首乐谱的分类:1——10第一类,11——20第二类的前提下,要求找出其分类特征,依据分类特征给出分类方法。

初步可以看出直接以乐谱的演奏速度v 为分类特征,可以得到简单的分类依据:v>100为第一类,v<100为第二类,但有5首v=100的无法判断,分辨率为75%,所以以次为依据分类可判性不高。

为了找出归类特征,我们求出每首乐谱中不同音符在该乐谱中出现的百分含量ik p
∑==
8
1
k ik
ik
ik x
x p
可以分别算得第1类和第2 类已知类别的样品各乐谱中的每种音符的百分含量如下:
表2(第2类11-20) 并以此作出前20首乐谱各音符出现的百分含量为纵轴,以各音符序号为横轴作出折线图(红色为第一类,黑色为第二类)如图1:
图1
由图可以看出第一类和第二类分类程度并不明显,很多不同类的同种音符的百分含量分布点交织在一起,但仍然可以找出第3种音符(降8度)和第6种音符(节拍减半)的百分含量值分离比较明显,因此以这两种音符为分类特征。

不同分类特征的百分含量值差别比较大。

如下图2,假设第k 与第k+1种音符的第1类和2类百分含量值分离都较好,分辨度较高,可作为分类特征,但第k 种音符的百分含量值
x1(%)
x2(%) x3(%) x4(%) x5(%) x6(%) x7(%) x8(%) 0.4091 0 0.1364 0.0273 0.0545 0.3545 0.0182 0 0.5701 0.0841 0 0.0047 0.0327 0.2664 0 0.0421 0.5616 0.0137 0.1096 0 0.1233 0.1096 0.0548 0.0274 0.4127 0 0.2381 0 0.127 0.2064 0 0.0159 0.4688 0 0.1146 0 0.1354 0.1667 0.0521 0.0625 0.5 0.0694 0 0 0.125 0.2361 0.0139 0.0556 0.5833 0 0.0667 0 0.2167 0.0667 0.0667 0 0.4787 0 0.1383 0 0.0745 0.2872 0 0.0213 0.5299 0.0299 0.0448 0 0.0672 0.306 0.0075 0.0149 0.5652
0.1304
0.1015
0.2029
都较第k+1种的小得多。

若采用取平均值的判断方法即比较
)()(21)1(1,A k kA k i ik p p p p +++-+与)()(2
1
)1(1,B k kB k i ik p p p p +++-+ 的大小来进行分类,因为kA p <<A k p )1(+,kB p <<B k p )1(+,1,+<<k i ik p p ,从而使得第k 个点百分含量变化对分类影响很小,失去对分类的决定作用。

若采用欧氏距离分类模型的方法, 同样由于第k 个点的值较小,失去对分类的决定作用。

第1类已知10首乐谱的第k 种音符的概率几何中心:
∑==10
1
101i ikA kA
p p 第2类已知10首乐谱的第k 种音符的概率几何中心: ∑==10
1
101i ikB kB p p 由图2可以看出, 图2
k
k+1
在本题中如图一,第3种音符与第6种音符和以上分析相似,所以上方法均得不到较好的分类结果。

因此,我们定义相对分辨率来度量分类特征对分类的决定作用,并以此作为分类依据。

五 模型建立
定义相对分辨率:
A k p )1(+
1,+k i p B k p )1(+
kB p
ik p
kA p
|
|||____
kB ik kA ik ikA p p p p X --=
第i 首乐谱的第k 种音符对第1类的相对分辨率
这反映了第i 首乐谱偏离第1类而靠近第2类的程度。

(k=3,6)
|
|||____
kA ik kB ik ikB p p p p X --=
第i 首乐谱的第k 个音符对第2类的相对分辨率
这反映了第i 首乐谱偏离第2类而靠近第1类的程度。

(k=3,6)
由此得到判断依据:
iB iA X X <判为第1类 iB iA X X >判为第2类 iB iA X X = 不可分类
六 模型求解
6.1 求解方法及步骤
1)用 c++语言求出各音符的百分含量(见附录1)
2)根据求出的百分含量,在Matlab 中用plot (x,a,’r ’,x,b ,’k ’)对前二十首乐谱的折线图(图1)。

3)用Matlab 对相对分辨率进行程序设计并得到分类结果(见附录2)。

6.2 求解结果
对前20首的分类结果:
第1类:2,3,4,5,6,7,8,9,10,12
第2类:1,11,13,14,15,16,17,18,19,20
对待判乐谱的分类结果:
第1类:22,24,25,26,27,28,29,30,31,32,33,35,37,38,39,45 ,
46,49,50
第2类:21,23,34,36,40,41,42,43,44,47,48 6.3 结果分析
由对前20首的分类结果看出,第1首和第12首的判断为误判或异常,但判断的 确率仍然达到90%,较其他方法高,具有相当的正确性,且说明第3种音符和第6种音 符可以作为归类依据。

七 模型的评价
类的平均相对分辨率
个乐谱对第第121
6,3i X X k ikA iA ∑==类的平均相对分辨率个乐谱对第第221
6
,3i X X k ikB iB ∑==
7.1本文的优点:
1)本模型与传统的分类方法(如欧式距离(Euclid)分类模型等)相比,具有独特性,
定义相对分辨率为新的判断标准。

2)分类标准直观明了,且便于用计算机完成。

3)本模型的算法容易推广到其他乐谱的分析中,具有一定的实用价值。

4)基于已有的分类方式,利用音符的百分含量分布图直观简明地找出了分类特征。

7.2本文的不足:
1)所给的分类数据太有限,所以用本种方法较好,判别与已知样本的长度更段的
未知样本时具有一定的局限性。

2)一些新的想法缺乏理论依据,所以有些问题的解决带有一定的主观性。

3)本文纯粹从数学的角度来分类,缺乏音乐知识背景。

八 模型的改进与推广
1)方法改进:可考虑用相对分辩率的几何平均值与1的比较作为判断依据 。

2)精度的改进:第1类的kA p 和第2 类的kB p 具有一定的置信区间,因此在计算时
可用方差分析计算出其置信区间,在分类时给出更具体的范围,这样可得到更为精确的结果。

由于数据庞大,因此这种方法计算太复杂,本模型不予考虑。

但在实际生产和生活中要求较高的精度下是可取的。

3)模型的推广:本模型用定义相对分辨的方法作为分类标准的思想是一个可以推广
的较好的方法,具体思路推广思路:从任意给定的乐谱算出各音符的百分含量,选出具有代表性的几种,利用本文给出的相对分辨率标准,在结合其他分类方法的基础上,就可以给出一个具体的分类标准,具有一定的实用价值。

参考文献:
[1] 苏金明,阮沈勇,MATLAB6.1实用指南,北京,电子工业出版社,2002 [2] 姜启源,数学建模,北京,高等教育出版社,1978
[3] 郑莉,董渊,C++语言程序设计,北京,清华大学出版社,2003。

相关主题