当前位置:文档之家› 基因芯片相关图像技术的简单介绍

基因芯片相关图像技术的简单介绍

本科课程论文基因芯片相关图像技术的简单介绍张大力201330200125指导教师邓继忠学院名称生命科学学院专业名称14生物科学2班论文提交日期2017年6月9日摘要生物芯片是一种高效快速地生物学检测手段,以探针和底物的特异性结合为基本原理。

其反应结果常常显示为荧光点阵列,往往具有信息量大,信息密度大的特点,人工难以识别和处理,因此多采用自动化手段进行处理,包括图像技术和计算机技术。

本文简单介绍现有的几天芯片图像处理过程中所用到的图像技术。

关键词:图像技术、生物芯片、基因芯片。

1 生物芯片简介生物芯片是20世纪90年代出现的一种将分子生物学/基因工程和芯片结合的一项技术,根据性能可分为功能芯片和信息芯片两大类。

功能芯片是指在芯片上集成一系列反应所需的试剂和条件,在一块芯片生完成固定的,程序化的,复杂的反应,从而大大减少检测人员的劳动强度,并使检测过程快速方便。

信息芯片又可以根据芯片探针和探测目标的不同分为基因芯片、蛋白芯片、细胞芯片、组织芯片等。

[1]信息芯片是现在广泛使用的一类芯片,是在芯片基质材料上安装许多,基质可以是玻璃、金属、尼龙或者其他材料。

基因芯片又是信息芯片中最常使用的。

生物芯片上探针可与样品液体中的目标的特异性结合,结合的产物可以经过处理,在激光的照射下发出特定波长的荧光,如果没有发生结合的探针或者目标不会发出荧光。

用特定的光照射反应后的芯片,使其上面发生特异性结合的部位发出荧光,再用技术手段取得此时芯片的图像。

通过对芯片图像中荧光的位置,颜色、强弱进行分析可以推测基因芯片上探针发生反应的情况。

进而得知样品中待测目标的情况,包括样品中某同可以和探针特异性结合的目标是否存在,含量、浓度是多少等,这些信息可以作为进一步判断的依据。

2 生物芯片图像信息的采集反应后经光源照射发出荧光的芯片包含我们所需要的信息,所谓基因芯片的扫描就是指将含有大量的以微阵列方式排列的生物杂交反应样点的基因芯片以图像的方式读取出来,且在保证样点信息的能够准确描述前提下,扫描图像转变成可供计算机处理的数字图像[2]。

基因芯片以外的生物芯片的与基因芯片类似。

常见的生物芯片扫描仪有两种分别是:CCD 系统扫描仪和激光共聚焦扫描仪,中CCD 扫描仪的应用较为广泛。

[3]两种扫描方式各有特点:CCD扫描可以同时照明和扫描芯片上的大部分基质,获取的图像范围大,避免了移动芯片或扫描装置,减少了相关的移动机构,降低仪器的体积和成本。

共聚焦扫描系统可以抑制成像过程中弱杂散光的影响,并且在相同成像条件下分辨率较高。

[4]但是需要移动机构。

3 生物芯片中生物信息芯片图像的特点由于功能芯片的设计难度技术要求都很高,因此现在商业化生产和大规模使用的是信息芯片,即利用在芯片基质上大规模排列的探针来检测样品中目标物存在情况的生物芯片。

下面以(生物)信息芯片为例介绍生物芯片图像的特点:(生物)信息芯片是大量探针在面积很小的基质上紧密排列的点阵,每一个点对应一组探针。

在光照下发出荧光后,图像是密布排列的荧光小点。

有的呈行列规则排布,有的是不规则的排布。

(生物)信息芯片通过荧光信号位置,颜色,强弱来表示反应进行的情况,并判断样品中与探针结合的目标的有无,含量高低。

(生物)信息芯片的制作过程,反应过程,芯片反应后进行扫描的过程很容易受到各种内源性和外源性的因素影响,使芯片上的荧光点阵的形状发生改变,使芯片的图像变得不规律,并且使芯片的图像产生噪声和干扰。

4 以(生物)信息芯片为例简单介绍生物芯片图像处理如图是生物芯片图像从采集到处理的过程可以看到,从芯片到最后的数据要经过芯片图像、图像预处理、芯片图像识别、样点检测四个阶段。

4.1 预处理其中图像预处理包括灰度化和去噪两步,有些时候还要对图像进行增强。

通过扫描仪获得的图像是彩色数字图像,了方便处理首先要进行灰度化。

[5]在芯片图像识别前需要对芯片图形进行去噪,这是因为在芯片的制作过程、反应过程中不可避免的会有灰尘以及反应物本身(细胞的碎片、变性沉积的蛋白质)的干扰,在图像上产生噪点,同时在激发荧光扫描的过程中也会因为背景、光源和扫描仪器等的原因给图像造成干扰,峰噪声的亮度甚至大于基因靶点本身[4]。

由于芯片图像的信息集中在微小的荧光点上,因此要对图像进行去噪的处理。

根据噪声以及图像的特点不同,去噪方法也是多种多样。

经典的去噪方法有:空域合成法、频域合成法和最优合成法等,较为常用的滤波器有均值滤波器、中值滤波器以及数学形态学的图像滤波方法等[5]常用的线性滤波方法对加性高斯噪声有着较好的处理效果,对于离散的脉冲及高频信号的处理效果一般,且容易损害图像的边缘特征[3]。

所以在生物芯片去噪的过程中常采用非线性滤波的方法。

刘国传等在生物芯片图像分析的研究进展中对目前广泛采用的均值滤波、中值滤波、数学形态学滤波和小波变换滤波方法进行了总结和比较。

邵桂芳等利用数学形态学的碟形结构算子进行开运算来评价图像质量,再利用基于最大类间方差的自适应阈值分割或固定阈值分割方法去除高亮噪声,更有效地保留图像边缘和细节信息。

在图像增强方面,将小波变换同数学形态学和模糊集合等理论相结合,提高了低灰度区域和高灰度区域的对比度,改善了图像增强效果。

近年来,曲波变换、模糊理论等与小波变换或数学形态学相结合的研究也越来越多。

[5]有些预处理的过程还包括对图像进行增强处理,有时在芯片图像识别的步骤里进行。

下图为参考文献[5]肖丁.生物芯片图像分析与处理方法的研究中蛋白芯片的图像以及灰度直方图,可以看到像素的灰度集中在灰度较高的区域,未能充分使用灰度空间,不利于提取信息。

[5]因此需要进行增强处理,使得后面的工作更容易。

对于图像增强可以采用直方图均衡化的方法,4.2 芯片图像识别经过预处理的图像就可以进行芯片图像识别了,由于生物芯片的最终目的是要由芯片上的荧光点所以需要经过图像识别来将图像中含有信息的部分取出来,这一步骤包括图像定位、图像分割。

芯片图像中的每个样点都包含着一定的生物信息,所以需要通过图像定位和分割将每一个阳电的图像单独提取出来以供识别。

定位是将芯片图像网格化,用网格对图像划分图像。

该方法类似用一张网去穿透基因芯片图像,留下大小相等的正方形网格线,每个网格均能完整包含一个靶点,过该方法能有效降低靶点分割的误差。

有基于模板匹配的网格定位法、基于投影的网格定位法。

基于模板匹配的网格定位法以前用的比较多,但是有很大的缺点。

这是因为生物芯片由于制作工艺的原因,荧光点的位置有时不是固定不变的,可能相对其他点发生偏移,这就使得用模板匹配进行网格化有时网格里没有样本点,或者有多雨一个样本点,给后续的分割带来麻烦。

基于投影的网格化是将图像所有像素点的灰度值分别在直角坐标系的垂直和水平两个方向进行投影和累加。

由于基因样点在芯片图像上是按照点阵列的方式整分布的有一定规律性,此得到的灰度累加值在直角坐标系上的分布就会呈现明显的波峰和波谷形态。

类似于文字识别中的行列的划分。

网格化是为了更好的分割芯片图像,但是有些生物芯片的识别系统不进行网格化而直接分割也是可以的。

尤其是对于一些不规则的芯片,难以进行网格化。

一些软件系统直接利用特殊的算法对图形进行分割。

例如在引文[4]中,展示了一种不规则的基因芯片,并且介绍了一种分割这种芯片的Snake模型方法。

可以看到图中芯片的荧光点并不是按照网格规则进行排列,传统方法面对这类芯片时难以奏效。

4.3 样点检测及后续经过分割后的图像就是每一个样点的图像,这样的图像通过的荧光信号亮度和色彩的分析就可以得到可供科学家进行分析的数据了。

5 简单的总结以上就是对生物芯片相关的一些图像技术的介绍,可以看到在生物芯片图像处理的过程中,除去噪声和分割图像是当前技术上的难点和研究上的热点。

实际上,生物芯片出现已经经过了将近30年的发展,但还有很多问题没有解决,由于当前技术上的限制,在大规模使用的(生物)信息芯片上,芯片的准确性,可靠性都还没有达到成熟的地步,反应时总会产生大量假阳性反应,而且价格一直偏贵,唯一的优点是快速,在大多数场合下有时并不突出,目前很少有实验室使用生物芯片做大规模筛选,而随着测序技术,尤其是转录组测序技术的发展,(生物)信息芯片已经越来越走出人们的视野。

而(生物)功能芯片由于当前设计和技术水平仍未达到堪用的程度,生物芯片技术当前正处于一个困难时期。

期待生物芯片技术能在未来有更大的发展。

参考文献[1]康熙雄,王雅杰生物芯片技术发展现状及应用前景中华检验医学杂志,一[2]Peter Bajcsy. An Overview of DNA Microarray Image Requirements forAutomated Processing[C]. Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05)78-81.[3]尹宁. 基因芯片识别系统研究[4]周梁. 基于EED滤波和Snake模型的基因芯片图像分割算法研究[5]肖丁. 生物芯片图像分析与处理方法的研究[6]邓继忠,张泰岭. 数字图像处理技术[7]尹宁. 采用最小误差阈值分割算法的基因芯片图像分析对课程的感悟和建议很喜欢这个课程,感觉学到了不少东西。

对图像和图形以及相关的应用有了新的认识。

觉得数字水印技术很神奇。

对已图形技术中的一些重要的概念也有了一些认识,包括像素,RGB,频域处理,空域处理等。

也是第一次了解到傅里叶变换可以子啊图像技术里有广泛而深刻的应用。

关于图像技术部分我有些建议,1.老师可以适当的增加关于数学和编程的内容,邓老师在讲课时总是极力使用通俗的方式讲授,目的是为了照顾所有人,但我觉得其实老师有些低估学生们的接受能力,毕竟学生也是按照自己的兴趣来选这门课的,应该是可以接受这些。

2.希望调整上课时间,上到10点钟太晚了。

3.虽然老师说不讲ps,但是我还是希望老师可以增加一些我们平常使用电脑过程中可以用到的技能和知识,这回增加大家的兴趣。

相关主题