第一章绪论计算机图像处理在医学领域的应用越来越广泛,白细胞图像的自动判断就是其中的代表之一。
它能有效地减少主观干扰,提高工作效率,减轻医生负担。
近些年来,计算机硬件技术和光谱成像技术的飞速发展,使得成功研制开发出小型实用的基于多光谱的白细胞图像自动分类识别系统成为可能。
本文研究的主要目的在于对白细胞多光谱图像分割进行初步的探索研究,为系统中其后的白细胞能够准确地分类识别奠定基础。
本章简要阐述了基于多光谱的白细胞图像分割的应用背景和研究意义,回顾了国内外细胞图像分割和多光谱遥感图像分类的研究发展状况,并简要介绍了本论文的主要工作。
§1.1 概述§1.1.1 白细胞检验白细胞的光学显微镜检查是医院临床检验项目之一,特别是对各种血液病的诊断占有极其重要的地位。
它的任务是观察或测定血液中的各种白细胞的总数、相对比值、形态等,用于判断有无疾病、疾病种类以及严重程度等,特别是对类似白血病这类血液病诊断具有更加重要的意义。
白细胞分类计数的传统方法是将血液制成涂片,染色后,临床医生在显微镜下用肉眼按照有关标准,如核的形状、细胞浆的量和颜色,细胞浆颗粒的大小和颜色,整个细胞形状、稀薄与细胞间的接触等,来观察和检查这样的细胞标本[1]。
然而这项工作十分繁重,工作效率低,容易误判,且人工识别误差随检查人员而异。
同时通过观察的细胞数目较少,从统计的角度看,因样本集较小而影响诊断结果的可靠性。
计算机图像处理与分析技术伴随着信息技术的不断进步在最近20年间得到了飞速的发展,已经迅速渗透到人类生活和社会发展的各个方面,这为智能化细胞分析仪代替人工方法提供了基础。
因此,借助于现代计算机技术结合临床医生的实践经验,采用图像处理技术对图像进行处理,从而对细胞进行识别,对于医学科研与实践,以及临床诊断方面有着现实意义和非常广阔的前景。
目前已经制成的自动白细胞分析仪主要有两种类型:一类是用组织化学染色法,通过连续流动的系统,以光电效应的方式分别数出单一细胞,并可同时报告白细胞总数、各类细胞的百分率和绝对值。
因为该法不是由细胞形态学特点识别各类白细胞,所以不能目视观察白细胞形态,亦不能保留样本,对感染中毒细胞无法识别。
另一类是原型认定型,其工作原理模仿人“脑眼系统”[2]的智能识别过程,运用计算机图像处理和模式识别技术,将从显微镜与相机或摄像机得到的数字化图像进行自动处理分析和分类。
与前一种类型的白细胞分类仪器相比,其主要优势在于:(1)能获得丰富的关于细胞形态、色彩、纹理等方面的多种信息,可综合运用图像处理及模式识别技术进行细胞分类,可取得高效准确的识别效果;(2)由于计算机的应用,保留了第一手资料,便于诊断的回顾和疑难病症的会诊,使系统在临床基础研究、病理资料积累等方面具有很大的潜力。
随着计算机技术的发展,第二类方法近些年得到了较大发展。
此类方法是目前的研究热点和发展方向。
§1.1.2 细胞图像分割概述细胞自动识别和统计系统主要方法是对原始图像进行分割,以提取单个细胞,然后对单个细胞进行分析处理和分类识别。
图像分析识别的一般过程如图1.1所示:图1.1图像识别流程细胞图像的分割是细胞自动识别计算机分析的第一步和关键性问题,其分割质量亦即与细胞的吻合程度,将直接影响到特征参数提取的准确性和分类系统的最终识别率。
传统细胞图像的分割,就是将血液中的白细胞自动检出,并在除去图像中各种噪声干扰的基础上,将单个白细胞图像划分成背景、细胞浆、细胞核三个区域。
白细胞图像的分割包括两个方面的任务:(1)从一幅血液图像背景中自动检测出待分类识别的单个白细胞区域;(2)为了计算细胞的特征参数,应将检出后的白细胞中的背景部分清除,并将细胞核与细胞浆分为不同的区域。
§1.1.3 白细胞的分类及特点白细胞是人体血液的重要组成部分,由核和原形质(细胞浆)两部分组成,为无色、球状有核细胞,根据包含在核与原形质中的颗粒不同,分成颗粒细胞、单核细胞和淋巴细胞。
颗粒细胞又根据颗粒的性质不同分为嗜中性粒细胞、嗜酸性粒细胞和嗜碱性粒细胞。
中性粒细胞根据核形状又可分为中性杆状核粒细胞和中性分叶核粒细胞。
观察白细胞图像,可以发现该类图像具有下述特点:(1)显微细胞图像反差小,有些图像由于各种因素产生的噪声多,图像背景不均匀。
另外,由于人工涂片和染色的非标准性,常常出现因染色剂过浓或染色时间过久,致使细胞结构模糊不清;(2)在一个细胞图像采样视野内,除了出现1~2个白细胞外,周围存在一些次要的区域,如大量的成熟红细胞和少量凝血细胞(血小板)等。
红细胞无核且呈圆盘状,细胞中央稍淡,直径约为7.5µm,红细胞的分布密度约是白细胞密度的800倍,凝血细胞的胞体小,呈星状,约为红细胞的1/4~2/3,凝血细胞具有粘附性且常成堆出现在图像中。
以下是经过Wright 染色后各类细胞的显微图像:§1.2 目前国内外研究现状由于将光谱成像手段应用到显微细胞图像处理的研究工作才刚刚兴起,目前已公布的关于这方面的论文和相关资料都很少,由于多光谱最初是用于遥感成像中,且在遥感领域,多光谱图像的分割已经取得了非常丰富的研究成果。
因此本节从传统细胞图像分割和多光谱图像分割两个方面来阐述研究现状。
§1.2.1 细胞图像分割方法概述传统的细胞图像分割按对象可以分为灰度图像和彩色图像两类。
传统的细胞图像分割方法大多是针对灰度图像进行的,然而由于上一节所阐述的白细胞图像分割中的几个难点,使针对灰度的分割方法无法准确分割出细胞图像的各种成分。
如果把灰度信息看作是一维的话,那么彩色图像包含的信息是三维的,信息量比灰度图像多。
所以近年来的细胞分割算法主要针对彩色图像来展开,并取得了一定的成果。
细胞图像分割方法大致可分为三类[3]。
1、基于区域的分割方法阈值法:是一种简单而有效的图像分割方法,早期的基于直方图的阈值分割方法主要针对灰度图像,实现简单,计算量小,但其无法有效的分辨白细胞图像中的诸多成分,局限性较大。
近年来,针对彩色图像,人们选取RGB 空间或HSI 空间中的某一个通道或者是它们的线性组合来进行阈值分割,使得分割效果有所提高。
文献[4]中则利用RGB 中的G 通道来区分核和其他区域,根据对血液图像的直方图分析,应用自适应多阈值分割方法完成对白细胞核的提取以及背景的扣除,实现了白细胞的自动检出。
对胞浆的分割中,提出基于局部颜色相似性和凸图1.2 经过染色后的白细胞显微细胞图像性收敛控制进行区域生长的分割方法,取得较为满意的结果。
文献[5]中将白细胞分割分为三个步骤,第一步实现白细胞的快速定位,针对白细胞核在R通道中灰度值较低的特点,检测出该图像中有无白细胞,如果有,则划定包含白细胞区域的一个矩形。
第二步,分析该矩形区域内的亮度直方图,最亮的部分为背景,最暗的则是白细胞核,然后再利用B通道中红细胞成分较亮的特点,找出细胞浆的位置。
第三步,通过形态学中的腐蚀和膨胀使轮廓线趋于平滑。
聚类:也是一种常用的分割算法。
它指的是根据数据本身的特征将其分至不同类别的过程。
输入的图像数据首先进行特征提取(如颜色,纹理等),然后根据这些特征按照一定的准则把图像分成具有特征一致性的区域。
文献[6]中,采用模式识别中的均值聚类算法并结合分裂算法确定细胞核的颜色以及细胞的个数,从而从彩色图像中分割出了细胞核;在确定细胞核的基础上,该文参照阈值分割和数学形态学中的流域分割的原理,提出结合两种分割算法的方案,最终确定每个细胞核所对应的白细胞的区域,成功地分割出单个的白细胞。
2、基于边界的分割方法基于边界检测分析的分割方法近年来研究很多。
Kass[7]提出了活动轮廓模型,在确定初始轮廓的情况下,利用一定的能量表达式,通过将总体能量最小化,达到边界和形状因素之间的平衡。
近年来人们把动态规划、神经网络和贪婪算法[8]等应用到了边界优化上,能够比较快速地得到某个准则下的最优边界或局部边界。
文献[9]针对DNA染色法处理后的标本图像,利用彩色空间RGB中R分量直接对细胞图像进行分割,先对图像进行全局二值化,确定细胞的初始轮廓之后再采用活动轮廓模型逼近真实的轮廓。
该论文提出的分割方法取得了比较好的效果。
3、基于区域与边界模型的分割方法区域生长的基本思想是选定若干种子区域或种子像素,将其邻近的像素按某种相似准则归入区域,使得区域逐步增长。
与阈值法相比,这种方法除了考虑分割区域的同一性,还考虑了区域的连通性。
区域生长的效果一般由种子区域和相似性准则(或称生长准则)的选择决定。
如何使用鲁棒的非参数方法完成选择是近来区域生长算法研究的热点。
J.M.Chassery[10]在80年代后期利用白细胞的局部颜色相似性和形态特征,用区域生长方法对骨髓细胞进行了分割,得到了较好的效果。
文献[11]同样利用局部颜色相似性和白细胞的凸性特征,较好地解决了白细胞图像分割问题。
§1.2.2 多光谱图像分割方法概述多光谱遥感图像分类是模式识别技术在遥感技术领域中的具体应用,是遥感数字图像处理的一个重要内容。
多光谱遥感图像分类技术的研究包括特征选择与提取和算法设计两个主要内容。
特征选择与特征提取的方法很多,对于多光谱图像分类的特征选择,起初大部分集中在波段选择上;后来针对不同的分类目的,采用各种数学变换来提取一些有用的分类特征;最后光谱波形特征、纹理特征和其它一些变换特征都尝试着用于遥感图像分类。
1、遥感多光谱图像的分类算法概述遥感影像分类是遥感界最重要的研究领域之一,因为分类是对遥感影像进行进一步分析的基础。
根据数学模型的应用,遥感影像分类可分为参数分类和非参数分类。
参数分类要求数据按一定的数学模型分布;非参数分类则不要求数据的分布服从一定的数学模型。
在实际应用中,遥感影像分类可分监督分类和非监督分类。
监督分类和非监督分类的最大区别在于,监督分类要求首先给定类别,而非监督分类则由图像数据本身的统计特征来决定。
对于分类算法的研究也百花齐放,下面简单介绍两种常用的分类算法:(1)最大似然分类法(Maximum Likelihood Classifier-MLC)基于贝叶斯决策的最大似然分类法[12,13],属于监督、参数分类算法,有着严格的理论基础,对于呈正态分布的数据,判别函数易于建立,有较好的统计特征,其贝叶斯分类错误率最小。
在文献[13]中利用非监督分类的结果来估计各类的先验概率。
为了突破最大似然法的一次划分模式类的限制,提高分类精度,许多复合算法都以最大似然法为基础构造,Xiuping Jia等[14]提出的渐进二类判别分类器就属于这一类方法。
Chulhee Lee等[15],Jayantha Ediriwickrema等[16]也是把最大似然法作为基础,构造了一种多层似然算法,把一次性划分变为多次划分,从而提高分类精度。