当前位置:文档之家› 基于路径与深度的同义词词林词语相似度计算

基于路径与深度的同义词词林词语相似度计算

法 与 MC3 0的 相 关 度 。 关 键 词 :同 义词 词林 ; 路径 ; 深度 ; 分 支 间距 ; 最近 公 共 父 结 点
中图分类号 : T P 3 9 1
文 献标 识码 :
A Pa t h a n d De p t h - Ba s e d Ap p r o a c h t o WO r d S e ma n t i c S i mi l a r i t y Ca l c a l a t i o n i n ,wh i l e d y n a mi c a l l y a d j u s t i n g t h e s h o r t e s t p a t h b e t we e n t wo s e n s e s t h r o u g h t h e i r b r a n c h i n t e r v a l i n t h e l o w—
Gu a n g x i No r ma l Un i v e r s i t y,Gu i l i n, Gu a n g x i 5 4 1 0 0 4, Ch i n a )
Ab s t r a c t:I n t hi s pa p e r,we pr op os e a wor d s e ma nt i c s i mi l a r i t y a ppr o a c h b a s e d o n t he pa t h a nd de pt h i n Ci I i n . Thi s a ppr oa c h e xp l o i t s t h e s ho r t e s t p a t h be t we e n t wo wo r d s e ns e s a nd t h e d e p t h o f t he i r l o we s t c o m m on p ar e nt no d e i n
CH EN Ho n g c h a o, LI Fe i , ZH U Xi n hu a ,M A Ru n c o n g
( Gu a n g x i Ke y La b o f Mu l t i — s o u r c e I n f o r ma t i o n Mi n i n g& S e c u r i t y,
第 3 O卷
第 5期
中文 信息 学报
J 0U RNAL OF CH I NES E I NFORM A TI ON PROCES S I NG
Vo 1 .3 0,No .5 S e p . ,2 O 1 6
2 0 1 6年 9月
文章 编号 : 1 0 0 3 — 0 0 7 7 ( 2 0 1 6 ) 0 5 — 0 0 8 0 - 0 9
基 于路 径 与深 度 的 同义 词词 林 词语 相 似度 计算
陈宏 朝 , 李 飞, 朱新华 , 马润 聪
( 广西师范大学 多源信息挖掘与安全重点实验室 , 广西 桂 林 5 4 1 0 0 4 ) 摘 要: 该 文提 出 了一 种 基 于 路 径 与 深 度 的 同义 词 词 林 词 语 语 义 相 似 度 计 算 方 法 。该 方 法 通过 两 个词 语 义项 之 间
t h e h i e r a r c h y t r e e t o c a l c u l a t e t h e s e ma n t i c s i mi l a r i t y b e t we e n t wo wo r d s e n s e s .I n o r d e r t o i mp r o v e t h e r a t i o n a l i t y o f c a l c u l a t i n g t h e p a t h a n d d e p t h,we a s s i g n d i f f e r e n t we i g h t s t o t h e e d g e s b e t we e n t h e d i f f e r e n t l a y e r s i n c l a s s i f i c a —
的 最 短 路 径 以 及 它 们 的 最 近 公 共 父 结 点 在 层 次 树 中 的深 度 计 算 出两 个 词语 义 项 的 相 似 度 。在 处 理 两 个 词 语 义 项 的最短路径与其最近公共父结点的深度时 , 为提 高路 径 与 深 度 计 算 的合 理 性 , 为 分 类树 中不 同层 之 间 的 边 赋 予 不
同的 权 值 , 同 时通 过 两 个 义 项在 其 最 近公 共 父 结 点 中 的 分 支 间 距 动 态调 节 词 语 义 项 间 的 最 短 路 径 , 从 而 平 衡 两 个
词 语 的 相 似 度 。该 方 法 修 正 了 目前 相 关 算 法 只 能 得 出几 个 固定 的 相 似 度 值 , 所 有 最 近 公 共 父 结 点 处 于 同一 层 次 的 义 项 对 之 间的 相 似 度 都 相 同的 不 合 理 现 象 , 使 词语语 义相似 度的计 算结果更 为合理 。实验表 明, 该 方 法 对 MC 3 0 词对的相似度计算值与人工判定值相 比, 取得 了 0 . 8 5 6的 皮 尔 逊 相 关 系数 , 该 结 果 高 于 目前 大 多数 词 语 相 似 度 算
相关主题