SNOMED RT-------新一代医学参考术语集标准*李包罗** 李恩生摘要标准医学参考术语SNOMED RT (Systematized Nomenclature of Human and Veterinary Medicine reference Terminology) 是为了满足医学信息处理的广泛要求,在原SNOMED3.5版的基础上加入新的设计理念,于2000年面世的新产品。
作者*有幸受美国病理学家学会(CAP)邀请参加了1999年11月在华盛顿召开的SNOMED用户和国际翻译者大会,与SNOMED RT的设计者和制作者直接接触,了解了该产品的许多细节。
本文介绍了美国CAP所属SNOMED编委会开发和推广SNOMED RT的背景与现状,,SNOMED RT的设计思想、基本构成、应用前景以及它与原SNOMED 3.5版、UMLS及其它医学术语标准的关系。
1. 引言SNOMED已经发展了超过20年,其3.5版包括了150,000余词条,分别组织在12个不同的轴和章节中,它包括解剖学、形态学、正常与非正常的功能、症状及疾病体症、化学制品、药品、酶及其它体蛋白、活有机体、物理因素、空间关系、职业、社会环境、疾病/诊断和操作。
SNOMED的每一个术语(词条)均有一个编码与之对应,在疾病/诊断轴内,很多疾病概念还提供了与其它术语的交叉参照关系。
近年来,随着医学信息电子化处理的飞速发展,愈来愈多的应用受制于术语问题(terminology problem)。
医院信息系统的开发供应商希望有一种统一的编码系统来满足临床电子病历发展的需要;行政管理部门及医疗质量的控制者/研究者缺乏一种可以理解和评价不同医院/诊断临床纪录的标准术语集;医疗保险部门也需要标准的术语编码实现与医院及住院病人之间临床医疗诊断及治疗信息的自动化处理。
"术语问题" 的研究和应用越深入,就越表现出它的复杂性。
这种多方面的需要不是简单的"通用编码数据字典"所能够解决的,客观上需要一种新的术语集,它既可以满足用户结构化智能化的录入临床数据的需要,又能够用于优化自然语言处理,还能帮助另外一些人完成医学信息的存储、提取与分析。
总之,我们把这样一种更高层次的满足广泛医学信息处理需求的标准术语集称为"参考术语"(Reference Terminology)。
SNOMED二十余年的努力正是为了这样的一个目标。
因此,已被广泛应用的SNOMED3.6就成为新一代标准术语集产品SNOMED RT 的基础。
2. 参考术语定义:临床参考术语是一组概念(Concepts)和关系(Relationships)的集合,无论这些信息是来自个人、系统、或部门,它提供了一个通用的参考标准,用于全面的医疗保健信息的比较与聚合处理,。
临床参考术语的主要目的是满足与疾病、病人治疗及疗效相关的全过程的临床信息的提取与分析,同时也可用于像自然语言获取等医疗信息处理的其它方面。
2.1 概念表(Concepts Table)SNOMED RT 为了解决一个概念多种不同的术语表达方式的问题,引进新的编码"概念码"。
拥有同一个实质性内涵(概念)的不同术语拥有相同的概念码和不同的术语码。
概念码与SNOMED中的TermCode是相同的。
例如,在SNOMED RT中概念码D5-46100 是指阑尾炎,在SNOMED3.x中也是指阑尾炎。
每个概念都有一个唯一的概念码,但每一个概念码可能与多个术语相对应,例如:D2-04610 Paralysis of glottis 声门麻痹D2-04610.1 Paralysis of glottis 声门麻痹D2-04610.2 Paralysis of vocal cords 声带麻痹D2-04610.3 V ocal cord paralysis 声带麻痹显然,这里有多种术语表达同一个概念-声带麻痹,因此,D2-04610这一概念码对应了3个不同的术语码。
表2-1 概念表(Concepts Table)ConceptCode Fully-specified name statusDE-11200 Anthrax OKDE-11201 Cutaneous anthrax OKDE-11204 Pulmonary anthrax OKDE-11205 Pneumonia in anthrax OKDE-11206 Gastrointestinal anthrax OKDE-11207 Anthrax septicemia OKDE-11208 Other specified anthrax manifestations RETDE-11210 Anthrax manifestation OKDE-11300 Bacterial food poisoning OKDE-11310 Botulism OKDE-11312 Toxicoinfectious botulism OKDE-11320 Food poisoning due to Bacillus cereus OKDE-11330 Food poisoning due to Clostridium perfringens OKDE-11332 Food poisoning due to other Clostridia OKDE-11333 Food poisoning due to Clostridia OK表2-1给出了SNOMED RT 概念表的结构,它是由三部分组成的:概念码、全名和状态(OK代表在用,RET 代表已退役)。
表2.2 术语表(Terms Table)ConceptCode TermID Eclass TermDE-11200 DE-11200.1 01 Anthrax OKDE-11200 DE-11200.2 02 Anthrax,NOS NRDE-11200 DE-11200.3 02 Infection due to Bacillus anthracis OKDE-11200 DE-11200.4 02 Splenic fever OKDE-11200 DE-11200.5 02 Charbon OKDE-11200 DE-11200.6 02 Milzbrand OKDE-11201 DE-11201.1 01 Cutaneous anthrax OKDE-11201 DE-11201.2 02 Maliqnant pustule OKDE-11204 DE-11204.1 01 Pulmonary anthrax OKDE-11204 DE-11204.2 02 Woolsorters'disease OKDE-11204 DE-11204.3 02 Respiratory anthrax OKDE-11205 DE-11205.1 01 Pneumonia in anthrax OKDE-11206 DE-11206.1 01 Gastrointestinal anthrax OKDE-11207 DE-11207.1 01 Anthrax septicemia OKDE-11207 DE-11207.2 02 Anthrax septicaemia OKDE-11208 DE-11208.1 01 Other specified anthrax manifestations RET表2-2举例描述了术语表的结构:■术语ID给出了每一个不同术语的术语码■ Eclass 表达了术语的同义语关系■术语Term是指该术语的字符串本身■状态Status含义与概念表相同,表示该术语是否在用2.3 层次与关系表(Hierarchies &Relationship Table)为了提供一种连贯的和稳定的多层次的关系,SNOMED RT提供了一张关系表来显式地表达医学概念之间的复杂的、多层次的关系。
在SNOMED3.x中,这种关系通常是用编码的层次及交叉参照码隐式的提供的。
RT的层次拥有下述特征:■直接用关系表表达■显示的,概念码独立描述■每个概念可能拥有多个层次■多种类型的层次关系ISA 父子关系ASSOC-ETIOLOGY 病因关系ASSOC-TOPO 解剖关系ASSOC-MORPH 形态学关系■多种间隔关系的表述■被描述逻辑所支持和决定表2-3关系表(Relationships Table)Concept Code Relation Parent Concept CodeDE-11200 ISA DE-00000DE-11200 ISA DE-10000DE-11200 ASSOC-ETIOLOGY L-12200DE-11200 ASSOC-ETIOLOGY L-12202DE-11201 ISA DE-11200DE-11201 ASSOC-ETIOLOGY L-12202DE-11201 ASSOC-TOPO T-01000DE-11204 ISA D2-50000DE-11204 ISA DE-11200DE-11204 ASSOC-ETIOLOGY L-12202DE-11204 ASSOC-TOPO T-028000DE-11205 ISA D2-50140DE-11205 ISA DE-11200DE-11205 ASSOC-MORPH M-40000DE-11205 ASSOC-TOPO T-28000DE-11206 ISA DE-11200DE-11206 ASSOC-ETIOLOGY L-12202表2-3给出了SNOMED RT 关系表的结构,它是由三部分组成的:概念码、关系及该概念的上层概念码。
2.4 描述逻辑(Description Logic)SNOMED编辑委员会选择了类似知识表达系统规则(KRSS,Knowledge Representation System Specification) 的方法来表述SNOMED的概念.例如,在RT中描述术后食管炎(Postoperative esophagitis,D5-30150)这一概念的逻辑表达式是:D5-30150:D5-301000&(assoc-topography T-56000)&( assoc-morphology M-40000)&( assoc-etiology F-06030)有了统一的逻辑表达式,形式化的处理临床医学概念间的同义语、冗余和层次就成为可能。
3. SNOMED RT 与UMLS及其它术语集美国病理学会的专家们认为,没有必要一定要使参考术语集去满足那些优化用户界面及自然语言应用之类的特殊要求。