当前位置:文档之家› DNA微阵列的数字图像处理

DNA微阵列的数字图像处理

2OO2年1月 第19卷第1期 

中国医学物理学杂志 一17一 J|n,2002 VoL19 No1 

DNA微阵列的数字图像处理 

都立巍’,单如梅 (第一军医大学1.全军重点医学图像研究室 李树祥‘,韩慧霞 2垒军重点肿瘤研究所,广东广州510515) 

摘要:从擞阵列囤锥中提取基因表选和识剐基因,井进一步测定基因的萌能是DNA擞阵列研究的主要目标。而擞阵列 圉像处理通过定住和提取每个eDNA靶点上振升的信号强度,井通过计算平均灰度值和分折强度比丰等为生轴学謇进 行更高层的基因分析提供必要条件。奉文介绍采用虹绿双色荧光标记杂交实验进行擞阵列图像处理几个关键步暮:擞 阵列靶区的分割、背景强度的提取、靶点检剥、靶点灰度提取、靶点表选程度分析。 关蕾词:图像处理;DNA擞阵列;基因表达 中田分粪号: l_4 文献标识码:A 文章编号:1005_202X(2002)OJ—0017-03 

前育:DNA徽阵列技术,是最近生物基因芯片技术中发展 起来的的一个重要分支,其最大优点是能够在一个实验里同时 得到几千个基因的表达 1。DNA微阵列杂交实验的每一个数据 点(靶点)表示一个特定基因在特定实验条件下的表选程度。实 验条件是要有徽阵列的构造(DNA芯片).即把几千个已知基 因分别放到固定位置的实验点(靶点)上.形成DNA阵列,然后 整个阵列的靶点同时与要研究的某种细胞样率(eDNA混合 物)发生反应。对实验后的DNA杂交膜进行扫描就得到了有待 进一步处理分析的DNA徽阵列图像。 微阵列图像处理目的是要从每个eDNA靶点提取探测强 度或比率,逭样,生物学家能容易地解释结果,或作更进一步的 高层分析 微阵列图像可谲【于多种扫描方式和杂交方法(即荧 光或者放射性探针),为了简化讲述,本文选取双色荧光探针杂 交实验得到的傲阵列图像作为主要的图像处理对象。一悟典型 的彩色图像如图1。 在该例中,杂交实验采用两种染色标记(红色荧光标记和 

图1 红绿彩色DNA擞阵列田像 绿色荧光标记)的双探针方式,通过扫描杂交实验生成杂交膜, 将两种探针的信号强度分别映射到RGB彩色图像的相应颜色 通道中,形成一个彩色图像。微阵列构造为14x96(14 ̄96 11 plales)共有1344十eDNA靶点。处理软件可以在微阵列图像 的相应通道中追踪eDNA靶点位置和强度并把它们映射到初 始DNA阵列(芯片)的位点(plate position)上。具体实现eDNA 微阵列图像处理可为 下几个部分:阵列靶区的分割、背景强 度的提取、靶区检测、靶区灰度提取、比率分布分析。 

1阵列靶区的分割 因为阵列中的每十靶点都被线性地扫描到相应的图像位 置上,所以可以安全地假定最终的待检测信号能自动排列在预 先定义的覆盖冈格上 如图2所示 同格的最初位置可以用手 

收搞日期:2001—6—12 作者简 :郝 ̄(1976-).男,垒军医学倒像重点宴验室硕士研究生 主要研究方向是可槐化和虚拟内窥镜。 

工决定或在徽阵列没有明显丢失行或列信号的前提下,利用特 殊的定向记号(Lartding Lights)确定。由于不同的扫描过程和杂 交规范的复杂性,我们对覆盖同格的韧始位置采用手工设定的 方法 有时.初始的覆盖同格还并不能精确地分割靶点。还可利 

维普资讯 http://www.cqvip.com 18一 中国医学钧理学杂志 第l9卷第1期 2002年1月 

用以下方法对网格定位:①检测高表达靶区;②查找靶区中心; ③从高表达靶区中心回归到它们对应子阵列的四个角点的坐 标。最后的回归方法可以避免由于噪声斑点或强度中心计算误 差造成的伪靶心定位。采用上述方法,每个靶区可以被准确地 分割,后续处理可以完全集中在一个个靶点上。由靶点的位置 可以追索回初始的DNA.微阵列位点(plate posi ̄on),这样,被 克隆的研究样本信鼠可以同每个靶点(即已知基因)联系上。 

2背景强度的提取 因为整个微阵列图像的背景并不是均匀分布的,所以我们 要提取背景的局部强度。由于很多技术原因,微阵列荧光背景 l曩声往往是渐进和平滑的。突变很少。如果突变发生,那/厶在它 周围的靶区的强度值一般不准确。通常某个靶点的局部背景强 度是通过计算相应网格(bounding box)边界点附近像素的平均 灰度值得到,但如果靶区过大,超过lOxlO的范围形成一个大 斑块或者靶区充满整个网格,用这种方法计算局部背景值将不 准确。 典型的荧光背景可以用Gaussian分布模型来描述。例如, 如果我们任遗以某个靶区中心为中心的一个较大区域(例如, 30x30像素),所有这种区域的灰度直方圉分布形式应该是相 似的,太部分背景像素灰度值相近,而靶区像素灰度值分布在 较高的灰度区间上。因此该直方图分布的高斯摸型的定位可以 提供渡靶区局部平均背景强度,直方图的左边区间提供了局部 背景强度的延拓。 3靶区检测 撖阵列图像处理的难点之一是在网格区域(bounding box) 内划分靶区。每个靶区由于实验时eDNA放置的原因,一般略 呈环状。但是由于eDNA沉淀或交杂过程中引人的其他因素, 最终的真实靶区图像可能只是这种理想圆形靶区里的一个子 集(见图3)。因此在环状区域内测量精确靶区的真实强度显得 非常重要。 我们在此先采用了图像分析惯用的固定闰值法。阈值 由 局部背景平均强度m和它的标准差5决定: =m+35。但是, 简单的固定阈值法在对低表达的靶点进行分析时往往由于信 号与背景差异过小而失败。为了避免这种情况.需要采用一些 复杂的阐值方法。可以采用的方法之一是用Mann—Whitney方 法口,这个方法从背景中提取样本点,然后对靶区像素点进行加 田3理想圆形靶区中的真实靶医 权和假设测试(r阻k—s1lm hypothesis teBt)。这种方法可以让用 户指定靶区捡铡的可信程度,因此具有较高的灵活性 4靶区的强度值提取 靶区确定后,强度就可以被测量。对双色系统,我们首先把 从绿色通道检测剜的靶区和从红色通道捡测剜的靶区舍起来 分析。理由报简单:因为两个探针在相同的靶点被杂交,所以, 如果我们观察两者之一的输出结果,它必然属于同一措在靶 点。 探针信号强度测量值是靶区内的像素点的平均灰度值。红 色通道探针和绿色通道探针的测量值均等于将对应靶区内的 平均灰度减去局部背景灰度,于是红绿两种探针强度测量值的 比率(1Et绿)就能计算出。很明显,比率测量为红绿两种探针对 应靶区测量到的平均强度的比率,平均强度测量在一定程度上 对数据产生一种平滑的作用。迁可选用以下两种比率测量方 法:一是计算红绿对应靶区内每对像素灰度值比率的平均值; 二是计算靶区内每个像素点位置的红一绿灰度值的线性回归的 斜率。 

5比率分布分析 这就是用表达比率的计算来判定基因表达是否在红一绿的 通道之间存在显著整异。采用这种途径是凭直觉 ,因为红绿实 验采用两种类似样奉导致它们表达比率应近似等于1。假定从 撖阵列图像中提取出的比率(1)满足下列条件:∞规范化;② 不相关;③为非负值;@常系数变化。比率分布可近似如下式: 

广T ( )一』 L 硝 ‘ 

c(1“ ) 、/2.『r 其分布参数能使用最大相似法估计.并且.比率校准采用 选代法(假定两种通道不是规范化的)。为了满足从红色剜绿色 没有强度变化这个无谓的假设,可选一组看隶基因作为研究对 像。它们被证实在大多数实验里是稳定的(即R/G=1)。被称作 看家基因组是因为这些基因的巳知特性不但建立在生物学原 理之上.而且基于在无数实验条件变化下观察计算得剜的戚千 上万孜的实验结果,看隶基因组的选择已由对相应的mRNA 样品标整建摸,而这些mR/qA样品通过Cy3和Cy5两种方法 取自sBm单元线(UACC—9o3)。 由看家基因组的实际数据估计得到的比率分布和预计的 比率分布(c参数)很接近。此外.比率分布的峰值正确地被校 准为1,这真是我们所期望的,因为红绿两探针的实验样本在 本质上是相同的。将我们的测量建立在比率分布分析上的重要 性是:这样,我们对每一孜比率测量能够联系一个置信区间 (cotLfidence interva1),以便每次有明显差异时能容易地被察 觉 更重要地,这种方法使我们可将每个比率测量值与一个比 率分布峰值联系起来。最终,从上述的方法中得到高质量的测 量值。 

6展望和未来的工作 傲阵列图像处理技术的发展将随着微阵列密度的越来越 

维普资讯 http://www.cqvip.com 中国医学物理学杂志 第19卷第l期 2002年1月 19 基因芯片图像分析所做的必要技术准备。我们全军医学图像重 点实验室一直以来都比较若注国内外这方面的进展,将在不久 以后推出一套共享的微阵列图像处理软件,供大家使用.并发 表更深人研究的相关论文。 

参考文献: I1J Schenam.Quantive monitoring of gerte expre,ssi ̄patterns with B complementary DNA micm T y口】Science,1995,270,467-470. [2】M.B.Ei虻 Sl ̄llman.etc Cluster analysis and dis山y 0f 

genoⅡIe—wide∞ s 0n p甜t蚰 【刀.PlDc “ 0f the Nmio ̄l Academy 0f sci即懈,1998.9505):14863-8. 嘲M.Sehena,D.Shalon.ete.Quamitati, ̄monitoring of Ⅱe 。 嗍i0d patterns with a o0mple口 n ry DNA mlcmm ̄y【JJ Seiene ̄.1997,389(2强827一 1995.270:467_70, 【4J崔屹.等散字图像赴理技术与应用[^f1.电子工业出版社.1997 【5】David J.Knt ̄ki,Ladde vc++6【 Mim础Prem,1998. f6】http://vars.epd.unil.ch/bioeomputing/tumay/ h乜II1. 

Digital image processing of DNA microarray HAO Li—wei‘,HUA Ru—mei ,LI Shu-xiang ,HAN Hui-xia {J.Key Lab ofMedical PLA,First .yMedical Un ̄rs#y.c. g甜 510515: 2.Key Lab of Tumor Research.First Military肌 University,c 曲“510515, ) 

相关主题