阿尔茨海默病临床诊断标准的中国化痴呆是以记忆和其他认知功能进行性损害为特征的综合征。
流行病学调查结果显示,65岁以上老年人的痴呆患病率为7.8%,其中阿尔茨海默病(Alzheimer’s disease,AD)患病率为4.8%,占所有痴呆的60%~80%,是血管性痴呆(vascular dementia,VaD)的4.36倍,且随着年龄增长而增加。
目前使用的AD诊断标准如NINCDS-ADRDA、NINCDS-ADRDA-R、DSM-Ⅳ和ICD-10等都是以临床表现为基础的,参考病史、精神状态、认知和心理学检查结果,并除外其他可能导致痴呆的疾病。
这些AD诊断标准的敏感性和特异性在不同研究中差异较大,所以临床诊断的准确性亦有一定差异。
选择何种诊断标准用于我国临床,除了考虑其敏感性和特异性外,重要且易被忽视的是它们在我国语言、文化和社会背景下的适应性。
由此引出一个亟待解决的科学问题,即AD诊断标准的中国化。
1984年,McKhann等发表了“阿尔茨海默病临床诊断标准”,即NINCDS–ADRDA标准。
该标准采用了纳入标准、排除因素和3个等级的可靠性,即“可能的”阿尔茨海默病(PsAD)、“很可能的”阿尔茨海默病(PrAD)和“明确的”阿尔茨海默病(DeAD)。
它们之间的差异主要取决于临床和与临床相关的病理资料。
该诊断标准至今仍然是使用最广泛的AD诊断标准,筛查PrAD+PsAD的敏感性和特异性分别为83%和84%,且在评估者之间具有中等程度的一致性。
随着与AD相关的组织学、病理生理学和生物化学等在诊断方面研究的进展,由法国Dubois牵头的国际专家小组对此进行了修订,于2007年发表了“阿尔茨海默病诊断的研究标准”,即NINCDS–ADRDA-R标准。
该标准把情节记忆损害作为AD诊断的核心特征,并新增了生物标志物等支持性证据,如头颅磁共振成像(MRI)显示的内侧颞叶(MTL)萎缩、脑脊液中Aβ42浓度下降、t-tau或p-tau浓度增高和PET的特殊图像。
针对PrAD提出了“核心诊断标准”、“支持性特征”和“排除标准”,对于PrAD的敏感性和特异性分别为68%和93%,且具有很好的操作性。
但该标准中情节记忆损害分界值受语言、文化和社会环境的影响,生物标志物检测技术如MRI和ELISA等在一般临床机构也不具备,且尚无全球统一的分界值供各国使用。
此外,该标准未考虑日常功能受损作为痴呆综合征诊断的条件,与其他标准如NINCDS-ADRDA、DSM-Ⅳ、ICD-10等定义的痴呆综合征有所不同。
为此,美国McKhann领导的阿尔茨海默病痴呆工作组也对NINCDS-ADRDA诊断标准进行了修订,于2011年发表了新的AD诊断标准,即NIA-AA诊断标准。
新标准提出了临床核心标准和研究标准。
核心标准关注记忆表现和非记忆表现两方面的特征,研究标准则纳入了生物标志物。
此外,新标准保持了延续性,即凡是符合NINCDS-ADRDA PrAD诊断标准者,也一样符合新的NIA-AA PrAD临床核心标准。
综上所述,AD的诊断要素包含以下6个方面:①认知损害病史,且进行性恶化;②临床表现有记忆损害和非记忆损害症状;③客观的精神状态检查或神经心理学测试证实存在认知功能障碍,包括综合认知功能和(或)特殊认知区域功能的减退;④干扰了工作或日常生活能力;⑤最好具备一项及以上生物标志物,如结构影像学显示内侧颞叶萎缩或海马体积缩小,或功能影像学显示特殊脑区皮层葡萄糖代谢率下降和(或)Aβ沉积增多,或脑脊液中Aβ42降低和(或)tau蛋白升高;⑥无法用谵妄或其他精神疾病来解释,并除外其他痴呆原因。
然而,由于受到资源和操作程序等因素的限制,无论新标准还是旧标准,它们提出的复杂的生物标志还不能作为广泛使用的AD诊断性筛查标准,神经心理学测评目前仍然是痴呆临床诊断的首选方法。
正如阿尔茨海默病痴呆工作组主席McKhann所指出的:AD的诊断仍然是一个临床诊断。
痴呆诊断主要通过医生询问知情者(患者或家庭成员)和神经心理测验来判断是否存在或正在发生痴呆,生物标志对诊断AD有帮助但不是必需的。
而且,由于不同国家和地区的语言特质、文化水平、社会背景等因素对神经心理学测评有一定的影响,无法用统一的测试和标准对所有地区的人群进行筛查。
因此,各个国家和地区应该结合自己的实际情况,研究出适合本国国情的筛查工具及其分界值,这也包括以汉语为母语的绝大多数中国人群中使用的AD诊断标准及其技术参数。
但如何使这些诊断标准中国化呢?有人认为直接引进诊断标准即可,有人认为许多诊断性项目不能直接照搬而需要转化,更有人认为诊断性项目转化了,相关的诊断性技术参数也应随之更新,这样才能满足我国AD临床应用的需要。
所谓引进,是把英文版诊断标准及其评估量表直接翻译成中文,而诊断性项目及其参数不变。
这样做的优点是能够及时地原汁原味地把国外技术引入我国临床,但潜在的问题是忽视语言、文化和社会环境的影响,可能导致诊断的偏移。
所谓转化,是把诊断标准中涉及的诊断性项目转化为中国的语言、习惯、规格、情景等,如简易精神状态检查(MMSE)中的world拼字代之以100连续5次减7,以检测注意力和计算力;将MMSE中定向力测评的国名、区域、街道、楼层,记忆功能测评的三个物体,语言测评的绕口令等换成中国人习惯的称谓和句子;将成人记忆和信息处理(AMIPB)中测评情节记忆的小偷故事中的词语音节、人物距离、物体大小、时间顺序等换成中国人熟悉的规格和情景等。
然而,这种诊断性工具形式上的转化虽然可以弥补诊断标准过于原则的不足,但因缺少跨文化和跨国度的诊断性试验证据的支持,也容易导致过高或过低估计它们在诊断中的作用,影响诊断的准确性。
事实上,语言、习惯、规格、情景等形式上的改变在一定程度上也会影响其内容,势必导致筛查结果的不同。
即使同一种语言,在MMSE检测中英国患者使用的三个物体(树木、时钟、小船)就比美国患者使用的三个物体(苹果、钱币、表格)更难记住。
因此,对于国外诊断标准,除了引进和转化外,还需要创新,其目的就在于建立中国语言、文化和社会背景下的诊断性技术及其参数,包括核心特征之一情节记忆损害分界值和支持性特征之一内侧颞叶萎缩判断值等关键技术,从而开发适合我国国情的AD临床诊断标准。
为此,教育部阿尔茨海默病防治研究创新团队长期从事痴呆诊断标准的引进、转化和创新研究工作,新近研究开发了中文版AD临床诊断标准。
该标准以McKhann等(1984)提出的PrAD诊断标准、Petersen(2004)提出的轻度认知损害(mild cognitive impairment,MCI)诊断标准和Ivnik等(1992)提出的正常认知(normal cognitive,NC)诊断标准为受试者分组标准,采取神经心理学量表、MRI、生物化学等研究技术和受试者工作曲线(ROC)等研究方法,对2007年版AD诊断的研究标准即NINCDSADRDA-R所涉及的诊断性项目及其分界值的中国化进行了一系列临床研究。
在建立中文版情节记忆损害分界值及其与MMSE、工具性日常生活活动量表(IADL)和痴呆评定量表(CDR)等诊断性量表、MRI海马体积及1H-MRS代谢组学的相关性基础上,建立了记忆、认知、机能、影像、生化等多参数联合使用的中文版AD临床诊断标准(表1)。
现分述如下:该标准沿用了以往从痴呆综合征到AD的两步诊断法和排除其他病因的诊断策略,临床诊断程序有三步,第一步是确定痴呆综合征,第二步是判断痴呆程度,第三步是鉴别痴呆原因。
其中第1条至第3条明确是否存在认知功能损害,第4条判断认知功能损害的程度是否足以影响到了工作或日常生活,以确定痴呆综合征的诊断。
第5条则是对整体状态的评定,要求达到轻度痴呆及以上程度。
第6条是利用MRI鉴别是否为AD病因。
第7条则是除外标准,包括非AD型痴呆和引起痴呆的其他可逆原因。
该标准实际上是一个 A D 操作性诊断标准(operational criteria for the diagnosis of Alzheimer’sdisease,OCDAD),第1条是NINCDS-ADRDA-R标准和NIA-AA标准共同提出的AD 诊断的核心特征,第2条也是NINCDS-ADRDA-R标准要求的AD诊断的核心特征,但采用了中文版延迟故事回忆量表(DSR)来评估情节记忆功能,其分界值则采用ROC提示的各年龄段最佳阈值,平均≤10.5分即可定义为情节记忆损害(表2)。
虽然这个均值比英文版低2.3分,但筛查AD的敏感性和特异性分别高达97.5%和96.8%,且3个月后的重测信度好(r=0.887,P=0.011),与MMSE得分具有很好的一致性(r=0.387,P=0.000),完全符合临床应用要求。
第3条与NINCDS-ADRDA-R 标准所主张的“情节记忆损害可能是孤立的,也可能伴有其他认知功能的损害”有所不同,强调必须有认知或神经心理学检测证实的认知功能损害的客观证据。
这一点是结合NINCDS-ADRDA、DSR-Ⅳ和NIA-AA的痴呆诊断标准来考虑的。
而认定是否有认知功能损害除临床表现外,主要采用MMSE不同教育程度分界值,平均≤23分即可定义为认知功能损害。
采用此标准所获得的NC组[(28.24±1.46)分]、MCI组[(26.85±1.93)分]和AD组[(14.71±7.25)分]平均分值之间都具有显著性差异(P<0.01),这一结果与国际同类研究报道的结果一致。
我国先前的研究采用MMSE不同教育程度痴呆分界标准(文盲组≤19分、小学组≤22分、初中及以上组≤26分)的敏感度达97%(乡村)和91%(城镇),对AD的检出率为93.6%。
我们自己先前的研究虽然也涉及了语言、执行功能、判断等特殊认知区域功能的诊断价值评价,但它们的敏感性和特异性都低于MMSE。
如ROC提示霍普金斯词语学习测试(HVLT)最佳分界值为15.5分时,区别AD与NC的敏感性和特异性分别为94.7%和94.5%,但区别MCI与NC的性能较低,分别只有69.1%和70.7%。
而检测执行功能的画钟测验(CDT)的敏感性则更低,只有67%。
此外,蒙特利尔认知评估(MoCA)筛查MCI的敏感性和特异性也分别只有72%和74%,与MMSE比较并无优势。
此外,MoCA不仅受教育程度影响较大,且较低的特异性和较弱的预测价值在英、法、荷、美、澳、加等西方同类研究中均不被看好。
因此,该标准采用了MMSE 不同教育程度分界值作为定义认知功能损害的筛查标准。
NINCDS-ADRDA-R没有把工作或日常生活能力受累列入AD诊断标准,但其他诊断标准如NINCDS-ADRDA、DSR-Ⅳ和NIA-AA都把影响生活和职业功能作为痴呆诊断的必备条件。