当前位置:文档之家› 数据挖掘技术在中医证候学研究中的应用.

数据挖掘技术在中医证候学研究中的应用.

辨证论治是中医理论和临床体系的重要支撑,贯穿于对疾病诊断、治疗、康复、疗效评价的全过程。

“证候”乃是从整体性出发,对个体疾病状态下特征的描述以及对疾病内在变化规律的概括,是中医有别于现代医学诊疗体系的一大特色和优势。

自上世纪50年代辨证论治的研究热潮兴起后,中医证候研究取得了一些进展,但仍没有找到合适的方法和途径。

如何从临床信息调查和分析中获取可靠的数据来支持中医证候理论,以及如何将中医药的优势按现代主流医药界能够理解的科学语言拿出证据来,是中医药走向世界的重要策略[1]。

1数据挖掘技术在现代中医证候学研究中的运用目前的数据库系统可以高效地实现数据的录入、查询和统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。

数据挖掘技术是一种揭示工具,借鉴其方法来研究中医证候的构成特点及规律,可加强与其他学科的交流与对话。

1.1医学多元统计学多元分析是定量分析事物复杂关系的一种数理统计方法。

目前,人们在中医药研究中运用的多元分析方法主要有聚类分析法、判别分析法、回归分析法、因子分析法、相关分析法等。

多元分析在中医药研究中的应用日趋广泛并凸现其重要性,尤其在证张琴1刘平2张文彤31.复旦大学附属上海市公共卫生中心(上海2015082.上海中医药大学肝病研究所(上海2012033.复旦大学上海医学院(上海200032数据挖掘技术在中医证候学研究中的应用【摘要】综述近10年综合运用临床流行病学与卫生统计学、数学、信息科学、人工智能学科等数据挖掘技术在中医证候学研究中的应用成果,并进行相应的评价。

提出应遵循现代循证医学的基本原则,充分考虑中医自身的特点,运用现代调查研究的基本方法,病证结合,以现代疾病为限定范围(在明确诊断及排除标准的基础上,规范、细致、较全面地采集中医以症状为主的四诊信息及相关检查数据,同时紧密结合临床治疗效果,动态观察证候在中药治疗干预下的演变规律,为建立中医辨证论治的疗效评价体系提供思路、方法与科学资料。

【关键词】证候学;辨证论治;数据挖掘【中图分类号】R2-02;R195.1【文献标识码】B 【文章编号】1007-1334(200603-0003-03Abstract:In this article ,it outlined and appraised the application results of the TCM syndrome by the way of data mining method by applying synthetically modern clinical epidemiology with medical statistics ,mathematics ,information science and artificial intelligence within the recent ten years.It raised the idea of ,according to thecharacteristics of Chinese medicine itself ,ap-plying the basic way of modern investigation and study ,combing the diseases with the syndrome ,which were limited in the scope of modern disease (on the basis of confirmed diagnosis and excluding standard ,which required the normal ,accurate and comprehensive collection of four diagnosing methods information and related data.Meanwhile ,we also combine with clini-cal effect ,observing dynamically the rule of the syndrome revolution that were treated by different herbal prescription ,which would offer us some new concepts and methods to build an evaluation system of TCM.Key Words :The theory of TCM syndrome ;treatment based on syndrome differentiation ;data miningAn Application of Data Mining in the Research of TCM Syndrome TheoriesZHANG Qin 1LIU Ping 2ZHANG Wen -Tong 31.Shanghai Public Health Center Affiliated to Fudan University2.Institute of Liver Disease ,Shanghai University of TCM3.Shanghai Medical College ,Fudan University[基金项目]上海市卫生局资助项目(034056[作者简介]张琴(1965-,女,上海人,博士,副主任医师,主要从事中医肝病的临床研究工作。

辨证论治候学方面的研究。

1.1.1聚类分析法聚类分析是研究“物以类聚”的数理统计方法。

张世筠等[2]运用流行病学和变量聚类分析的数理统计方法,将中医肝证的11个主要证型最后分类为实证、风证和虚证等3类。

研究结果不仅科学地解决了中医肝证的分类层次问题,而且从统计学角度明确了中医肝证分类的正确性。

张琴等[3]运用SAS软件对223例患者进行系统聚类和主成分分析,并结合专业知识对肝炎肝硬化中医常见的证候作出判别:第一类型表现为以实证为主兼见虚证,第二类型、第三类型表现为以虚证为主兼见邪实。

并显示湿热内蕴、血瘀阻络、气阴两虚为肝炎肝硬化的主要病机。

邓兆智等[4]根据163例类风湿性关节炎患者头发微量元素的检测结果,采用动态聚类法在多维空间进行分类,可以得出5种证型。

梁雄伟等[5]对221例中风急性期患者证候特点等进行了指标聚类,结果可分为4类。

1.1.2判别分析法判别分析法是根据某些指标的观测值对所研究的对象判断其归属类别的一种统计分析方法,中医药研究中的应用主要集中在诊断、证候以及病的计量研究方面。

王洁贞、陈东汉等[6 ̄7]利用脉图数据对平、弦、滑等脉的诊断,采用逐步判别分析法、最大似然法、Fisher逐层判别分析法等3种多因素分析方法建立判别式,结果符合程度较高。

陈群[8]将确诊的冠心病分为阳气虚与气阴虚,用逐步判别法选用脉图参数指标建立判别式,并进行主成分分析,结果回代符合率分别为82.00%和94.25%。

罗文豪等[9]用Bayes公式法等对720例慢性支气管炎肺、脾、肾虚证进行中医辨证的计量诊断,并建立用以判别各证型的证候频率及指数表。

吴圣贤等[10]对630例老干部体检资料进行脑动脉硬化症(CAS的计量诊断研究,建立的CAS中医辨证计量诊断的判别式对阴虚阳亢证和气虚血瘀证具有良好的诊断效能。

陈东汉等[11]用逐步判别分析法对脉图参数59个指标中能对分类起显著作用的6个指标建立判别式,判别高血压病与冠心病并发高血压病的正确率为91.03%。

李小兵等[12]将1192例心脑血管病患者分为痰证组与非痰证组,建立心脑血管病宏观辨证的判别方程,回代结果较好。

1.1.3回归分析回归分析是研究随机变量之间的统计相关关系的一种数理统计方法。

王阶等[13]对92例冠心病进行逐步回归分析,确认全血黏度、总胆固醇等5个因素对冠心病血瘀证的贡献最大,提示血瘀证的研究应在系统研究中确定其普遍性指标和特征性指标。

严云良等[14]对《中医养生大全》中的8种养脾中药方中白术、茯苓、人参的配伍用量规律进行分析,得到3者配伍用量规律的回归方程。

刘凤斌等[15]用Logistic逐步回归分析方法模拟专家对脾胃病诊断过程,结果与专家诊断的总符合率为88%。

1.1.4多元分析在中风病证候研究中的应用近年来在临床常见疾病的证候研究中,通过降维升阶的工作方法,使证候诊断呈现出一种复杂的立体交叉的组合关系。

这正符合患者特殊个体差异及医生灵活运用的需要。

国家科委科技攻关项目的“中风病证候学与临床诊断的研究”[16],是一个较好的范例,研究建立了中风病“风、火、痰、瘀、气虚、阴虚阳亢”等6个中医证候因素,在制定证候诊断标准的时候,只做6种,而在具体的临床应用中,可以组合出54种证候。

这是一种经过优化的研究方法,值得进一步探讨。

1.2人工智能方法由于传统的医学统计方法具有局限性,研究者们开始尝试运用模糊智能技术探索中医证候分类及疗效评估的方法。

应用数学建模、神经网络、基于案例的推理、图像处理、遗传算法、智能数据与时序分析、模式识别等多种技术深入地研究某种疾病,以建立更为实用、高效的疾病诊断智能系统。

同时对疗效评价、方案选优之类的问题进行辅助决策,充分发挥了数值分析的优势,即定量和定性的分析。

1.2.1模糊数学模型应用李波等[17]根据关幼波先生鉴别各种肝炎病的经验,运用有关统计数据建立肝炎病诊断的模糊数学模型,在中医的肝炎病诊断中引进了模糊子集的概念,在此基础上利用电子计算机建立了对应的专家系统。

张德舜等[18]在对183例慢性胃肠病观察的基础上,辨为6种证型,用评分赋值法进行分级,建立数学模型,用模糊综合评判法对辨证分型分级进行综合评判,为中医辨证论治的量化研究提供了一种方法。

廖云龙[19]从《伤寒论》六经的生理、病理等方面论述了六经辨证的模糊性,认为这种模糊性是《素问》的三位逻辑向多位逻辑思维方式的发展,将有助于对六经实质的探索。

1.2.2基于神经网络的运用周志坚等[20]构造了一个神经网络分级系统,并用于类风湿性关节炎寒热错杂证的病情分级诊断,初步探讨了神经网络用于中医诊断中的可行性。

边沁等[21]的研究表明,神经网络用于证候的规范化研究具有方法上的可行性。

王炳和[22]研究建立了一个8-5-7三层结构的脉象人工神经网络模型,经280例脉象的识别检验,结果表明,对7种脉象的识别准确率平均为87%。

因此,选择合适的工具对中医药大量数据进行多层面智能分析,是进一步更新和完善中医药知识的有效途径[23]。

1.3中医临床疗效评价的思路与方法辨证的意义在于对患者实施恰当的治疗,而目前的中医药临床疗效评价的体系仍在探索阶段。

相关主题