当前位置:文档之家› 基于信息处理的藏文框架语义关系研究

基于信息处理的藏文框架语义关系研究

第31卷总第77期 2 0 1 0年3月 西北民族大学学报(自然科学版) Journal of Northwest University for Nationalities(Natural Science) Vo1.31,No.1 Sep,2010 

基于信息处理的藏文框架语义关系研究 

多杰卓玛 

(西北民族大学中国民族信息技术研究院,甘肃兰州730030) 

[摘要]藏文框架语义知识语义关系分析的关键就是建立句子中各词语之间的语义关联关系。实现各框架间知识 的共享,获取更多的信息.文章引出了藏文框架语义知识、框架及框架元素并结合实例分析了以藏语句子为主,组成该 句子的词语或短语间的语义关系及框架形式表示该句子的语义为结构化. 【关键词】藏文;框榘;知识;分析 【中图分类号]TP391.1iH017 [文献标识码]A [文章编号]1009—2102(2010)01—0016一O4 

O引言 

语言信息处理的研究中,在国外,早在20世纪70年代末美国语言学家Fillmore从计算机科学中引 

入“框架”的概念,并把它应用到1997年在美国加州大学的伯克利分院由Fillmore主持的项目“基于语 料库的计算词典编篡工程”…中,到2009年5月为止,共收录了英语的11 600个词元,共构建了英语的 960个框架,其中6 800个词完成了例举标注,共标注了15万的框架语义信息【2】.这个语义框架 

(Semantic Frame)的构建,为人们提供了研究英语词汇语义及句法结构意义的方法.在国内,2006年由 山西大学的刘开瑛、由丽萍等人创建了一个以有限词语集合为描述对象的汉语框架语义知识库,共对汉 语1 760个词元(一个义下的一个词)构建了130个框架,涉及动词词元142个、形容词词元140个、事 

件名词词元192个,标注8 200条句子 J.到目前位置,藏语在这个领域的研究可以称得上是一块未开 发和挖掘的处女地.为了加快藏文信息处理的进程,藏文框架语义知识的研究和建设也是迫在眉睫. 

因此,本文是对藏文框架语义知识的语义关系这一角度出发,逐一分析并揭示组成语义的词语及短语内 部成分间的关系. 

1藏文框架语义知识 

在藏语言研究中,组成藏语句子的词语及短语在句子中占有重要的地位.比如:例句“商’ 

< ‘气 ’r.q。习’ ‘磊气。司旨’ 。 司1 ’ 日1 。 列 。 < 日 目r’中,“ 气 q吾。司1 ”、“ ai’ ‘ ”、“商‘ 闽’ 

、“ ’ 。 5{ 日 日1”是组成这个句子的一些词语和短语.其中,句子中的“ 日1’叩i 。1 5l ’ 

司 qf’并含有学习各种文化知识的意思.并且,词语“日 司”’为目标词,我们从这个目标词出发,通过对 该短语进行分析,得到了以日标词为中心的词语或短浯的语义关系形式化结构. 

短语: 司1 剖 ’司 司1 短语语义形式: ’ ‘司 ql—— ’目1 +司 一——哥 q旨’ +司 司‘ +舌气+司吾+ 

—— +目 

【收稿日期]2010—02—12 [基金项目】国家语委科研基金项目(项目号:MZll5—69) [作者简介】多杰卓玛(1970一),女(藏族),青海贵德人,讲师,硕士,主要从事藏文信息处理方面的研究 

一16

— 短语语义结构: ’ 。 ’q 司卜_一 日1 叩i ’1 ’占j +q 司.司 这个词语可以激活一个语境, 

该语境包括:蓠司 琶 。萝气。5I『日 ‘ 。 ‘气‘<1萄司’暂 ’萝 ’ 茂‘ ’气 。q ‘每 ’l琶 寻 ‘哥。舌气‘日旨’ 1 司茂‘ 

翻日1 ‘i 。 。日1 ’蓠日 1 日 琶 ‘ ’甏 ‘ 5I’ ’1 昌’ ’ ’司’ ‘司旨。 日1 琶 。日1、 R写 I 

等信息.语境是由萄q。5I『日 l主体耄 。 l地点 琶 。昌1对象 罄ciI时间等多个方面来定义的.前面 

的四个因素或四个成分设定了一个简单的语境:进修(深造)者在某个时间某个地点作了某事.其中语 境中的蓠司 5l I主体琶 ’ 1地点 。寻1 誉 耐间等内容又组成了这个语境的主要成分及知识. 

我们把词语“司 日”相对应的整体概念结构称之为框架语义知识. 框架语义是一钟图示化的表示方法,涉及各种参与者、外部条件和其他概念角色,称为框架元 素[引.框架元素是框架的主要组成部分.而框架元素又是颗粒度更小的词元组成的.比如例句“蔺 日1 

‘ 茂’ ’q’ ‘ ‘ 磊气‘目旨 ’ ’ 1。 ’ 荨I 司 司1”中,蓠司 5I 1主体、琶< 5 1地点、 誉气1时 

间等每一项都是一个框架元素.一个个的框架元素的集合形成了一个框架.如例句中的“司 日”’其实 

就是一个框架. 

2藏文框架语义知识的语义关系分析 

在自然语言处理中,对语义的研究文献[5】中,林杏光引用了陈望道先生提出的“六何”,即何人、何 

物、何时、何地、何故以及如何,以此来概括任一事件结构都可用7S视图,即事件由目的(Purpose)、主体 

(Actor)、动作(Action)、对象(Object)、辅助设施(Facility)、地点(Location)和时间(Time)7s个概念域构 成.然而对藏文词语的框架语义分析时,我们不仅要考虑到词语在句子中的7s这些概念域,还要考虑 

到各个词语框架与这些概念域之间的关系,从而确立以藏语词语为主的框架、框架元素、词元等.下面 分析句子的语义构成情况: 例1 藏文: 。 ‘ ’ ’两茂。司 。 ‘自’ 萄日’ ’马司‘琶<。寻 l 

汉文:从去年到现在,我在北大进修. 

从句子的横向看:“写司’琶 为该句子的日标词,由于“蜀司。蓉 与组成该句子的其他词语或短语间的 语义关系分析(见图1)后。得到了如下信息: 1)“ 。 司’ ”是目标词“司目鼋 的处所地.反之,“司q‘琶 是指深造(进修)人的在所处的位置 

里学习时的一种表现行为. 2)词语“ ”与目标词“昌司曾 ”问的关系是:“司司 蓉 的主体是“ ”,而“ 这个主体要实施的行为是 “司马 暂 .所以,它们两者之间可以用施为关系.即指主体实施某种行为. 3)词语“气 ’ 。 镯a 司 ”是目标词“司马鼋 的时间.因此,两者之间具有存在关系. 

图l词语或短语间的平面语义关系分析图 从句子的纵向看: 

目标词“葺司’琶<”中隐藏着更多的信息量.我们可以挖掘,如“蜀q鼋 ”的内容是什么,为什么要“青q’ 

暂 ,“葛q鼋 后达到的程度以及“葛≈鼋<”后的结果会如何等这些信息.从而将“暑目鼋 与隐藏的知识 点“琶<’昌茂 面 ‘可 ”、“琶<‘司茂’气 ”、“ 马 ”等之间建立关联关系.总之,将一个句子的纵向和 

横向语义综合起来要考虑它的整体语义,从而构成该目标为中心的框架语义网络. 

一】7

一 例2 藏文:昌气 。 。 ‘ q 目 ‘司宥 ’酉ql 

汉文:学习科学技术取得了良好成果. 例2的语义关系分析后,得到如下: 1)“晶 。 ’ ’ 司”与“ 司 司司<’ ’酉q1”两个事件之间有明显的因果次序,良好的成绩是 

因为之前学习过科技技术的原因.因此,两者之间具有因果关系. 

2)“贳 ’ 司1‘ ”是“ ’司”的内容,而“ ‘司”是对内容“ ‘ ’ ”的实施的行为.它们 之间是利用关系.即:某一动作利用某种资源. 。. 一’.. 

“ .嫡’ 怠 {季 l暑 

曩2 璃罨语.爻墓蒙;建车巨 匿 .‘ 袁翥 擎遍吴. 

窿,,,—、表豢i≮擎鸯誊. 

臣 … 袁 ≮擎誊豹・ 

3藏文框架语义知识的语义关系表示 图2词语语义关系分析图 写 ” 

根据例1、例2的语义分析结果,用框架网络形式表示以上两个句子的语义(见图2). 

首先,确定句子中的日标词,并以目标词为中心如例1中的“司司。琶<”和例2中的“碧< ”两个词语为 

中心进行框架网络. 

图3藏文框架语义知识的语义关系表示图 从图2看:“司 鼋 框架是由多个框架元素组成,或者是由激活“蜀q 琶 语境的多个场所构成的. 

其中“毫 ’ ”、“毫 ”、“ ”、“ 磊 ”、“弩<’昌f’、“导’ ”、“ 写 ”等都是框架元素.这些 框架元素是由更小的词元组成的.一个框架是以它相关的概忠结构组成的,这个结构具有一定的层级 

性.因此,在框架的描述中,词元是最小的框架构成单位,也是构成框架的层级中最低层的一级. 

4结束语 

本文是从藏文框架语义知识的语义关系这一角度出发,并结合实例逐一分析揭示组成语义的内部 成分闻的关系.为藏文信息科学领域的深人研究提供了参考作用,同时也为今后在藏文信息处理领域 

内的信息检索、自动语义标注、问答系统、信息捕取等的应用研究提供了参考依据. 

一j8

一 参考文献: 

【1]Theory and Practice.[2007一O3—12].http://framenet.icsi.berkeley.edu/ [2]Welcome tO FrameNet.[2010—03—123.ht印 ̄//framenet.icsi.berkeley.edu/ [3]由丽萍等.信息处理用中文框架语义知识描述方法研究.民族语言文字信息技术研究.第十一届全国民族语言文字 信息学术研讨会论文集[c],2007. [4]贾君枝、陈幼华.汉语框架网络知识本体构建研究[J].中国图书馆学报.2007(2).56. f5]林杏光.诃汇语义和计算语言学[M].北京:语文出版社,1999. 

Analyses of Semantic Relations between 

Tibetan Framework of Semantic Knowledge 

Duo Jie Zhuo Ma 

(China Minorities Information Technology Institute,Northwest University for Nationalities,Lanzhou Gansu 730030,China) [Abstract]The Tibetan framework of semantic knowledge mainly focuses on building a sentence associated with the various semantic relations between words and realizing the sharing of knowledge between the various frameworks for more information.This leads to the Tibetan framework for semantic knowledge, 

framework and framework elements.The semantic relation of the sentences,word and phrase in the sentence were also analyzed in the present.By using the framework of the semantics to indicate how the sentence is 

structured. [Key words]Tibetan;framework;knowledge;analysis 

(上接第lO页) 参考文献: [1]孔江平.语音多模态研究和多元化语音学研究[J].中国语音学报,2008,(1). [2]吴宗济,林茂灿.实验语音学概要[M].北京:高等教育出版社,1987.38—39. [3]清格尔泰.蒙古语语法[M].呼和浩特:内蒙古人民出版社,1992.42—44. [4]孙竹.蒙古语文集[M].西宁:青海人民出版社,1985.46—47. [5]吴宗济.吴宗济语言学论文集[c].北京:商务印书馆,2004.32—36. 

Acoustic Study of Mongolian Aspirated and Unaspirated Consonants 

JIN Ya—sheng ,HU A—XU2 

(1.University Office,Northwest University for Nationalities,Lanzhou G'd-qSU 730030,Chitin;2.China Minorities Information Technology Institute,Northwest University for Nationalities,Lanzhou Gansu 730030,China) 

[Abstract]The difference between aspirated and unaspirated consonants in Mongolian is usually interpreted 

as being strong or weak.It is generally believed that the airflow of unaspirated[p][t][k]is stronger than that of aspirated[p‘][t‘][k‘].With the help of experimental phonetics methods,the article has got such 

acoustic parameters as over—glottal pressure and airflow amount of Mongolian stops and affricates.Through the comparative analysis,the article holds that the difference between aspiration and unaspiration in Mongolian consonants lies not only in the different ar ̄ount and pressure of the airflow in obstruction 

relec ̄e,but also the time differences in the very release. 

[Key words]Mongolian;consonants;airflow and atmospheric pressure 

一19

相关主题