生物科学正迅速地演变为一门信息科学。
最明显的一个例子就是目前正在进行的HGP (human genome project),最终要搞清人类全部基因组的30亿左右碱基对的序列。
除了人的遗传信息以外,还有其它生物尤其是模式生物(model organism)已经或正在被大规模测序,如大肠杆菌、啤酒酵母、秀丽隐杆线虫以及中国和日本科学家攻关的水稻基因组计划。
但单纯知晓生物基因组序列一级结构还远远不够,还必须了解其中基因是怎样组织起来的,每个基因的功能是什么,又是怎样随发育调控和微环境因素的影响而在特定的时空域中展开其表达谱的,即我们正由结构基因组时代迈入功能基因组时代。
随着这个功能基因组学问题的提出(后基因组时代,蛋白组学)[1],涌现出许多功能强大的研究方法和研究工具,最突出的就是细胞蛋白质二维凝胶电泳(2-D-gel)(及相应的质谱法测蛋白分子量)和生物芯片(Biochip)技术[2]。
一.什么是基因芯片生物芯片,简单地说就是在一块指甲大小(1cm3)的有多聚赖氨酸包被的硅片上或其它固相支持物(如玻璃片、硅片、聚丙烯膜、硝酸纤维素膜、尼龙膜等,但需经特殊处理。
作原位合成的支持物在聚合反应前要先使其表面衍生出羟基或氨基(视所要固定的分子为核酸或寡肽而定)并与保护基建立共价连接;作点样用的支持物为使其表面带上正电荷以吸附带负电荷的探针分子,通常需包被以氨基硅烷或多聚赖氨酸等)将生物分子探针(寡核苷酸片段或基因片段)以大规模阵列的形式排布,形成可与目的分子(如基因)相互作用,交行反应的固相表面,在激光的顺序激发下标记荧光根据实际反应情况分别呈现不同的荧光发射谱征,CCD相机或激光共聚焦显微镜根据其波长及波幅特征收集信号,作出比较和检测,从而迅速得出所要的信息。
生物芯片包括基因芯片、蛋白质芯片、组织芯片。
而基因芯片中,最成功的是DNA芯片,即将无数预先设计好的寡核苷酸或cDNA在芯片上做成点阵,与样品中同源核酸分子杂交[3]的芯片。
基因芯片的基本原理同芯片技术中杂交测序(sequencing by hybridization, SBH)。
即任何线状的单链DNA或RNA序列均可被分解为一个序列固定、错落而重叠的寡核苷酸,又称亚序列(subsequence)。
例如可把寡核苷酸序列TTAGCTCATATG分解成5个8 nt亚序列:(1)CTCATATG(2)GCTCATAT(3)AGCTCATA(4)TAGCTCAT(5)TTAGCTCA这5个亚序列依次错开一个碱基而重叠7个碱基。
亚序列中A、T、C、G 4个碱基自由组合而形成的所有可能的序列共有65536种。
假如只考虑完全互补的杂交,那么48个8 nt亚序列探针中,仅有上述5个能同靶DNA杂交。
可以用人工合成的已知序列的所有可能的n 体寡核苷酸探针与一个未知的荧光标记DNA/RNA序列杂交,通过对杂交荧光信号检测,检出所有能与靶DNA杂交的寡核苷酸,从而推出靶DNA中的所有8 nt亚序列,最后由计算机对大量荧光信号的谱型(pattern)数据进行分析,重构靶DNA 的互补寡核苷酸序列。
二.芯片类型一般基因芯片按其材质和功能,基本可分为以下几类[4](一)元件型微阵列芯片1.生物电子芯片2.凝胶元件微阵列芯片3.药物控释芯片(二) 通道型微阵列芯片1.毛细管电泳芯片2 .PCR扩增芯片3.集成DNA分析芯片4.毛细管电层析芯片(三)生物传感芯片1光学纤维阵列芯片2白光干涉谱传感芯片小鼠基因表达谱芯片(MGEC)附:目前国内基因芯片常见品种.(上海博星公司)芯片品种芯片点数MGEC-20S 2000MGEC-40S 4000MGEC-80S 8000癌症相关基因表达谱芯片(CRGEC)分类芯片型号芯片点数肝癌相关基因表达谱芯片LiverC-16S 1626 LiverC-16D 3252 LiverC-9.5NS 954 LiverC-9.5ND 1908肺癌相关基因表达谱芯片LungC-7.3S 737LungC-7.3D 1474人类基因表达谱芯片(HGEC)芯片品种芯片点数HGEC-10S 1024HGEC-10D 2048HGEC-20S 2048HGEC-20D 4096HGEC-40S 4096HGEC-40D 8192HGEC-80S 8192HGEC-80D 16184三基因芯片的制备芯片种类较多,制备方法也不尽相同,常见的芯片可分为两大类:一类是原位合成;一种是直接点样。
原位合成适用于寡核苷酸;直接点样多用于大片段DNA,有时也用于寡核苷酸,甚至mRNA。
原位合成有两种途径。
一是光蚀刻法;一是喷印法。
光蚀刻法可以合成30nt左右,喷印法可以合成40-50nt,光蚀刻法每步缩合率较低,一般为95%左右,合成30nt产率仅20%;喷印法可达99%以上,合成30nt产率可达74%,从这个意义上说喷印法特异性应比光刻法高。
此外,喷印法不需特殊的合成试剂。
与原位合成法比较点样法较简单,只需将预先制备好的寡核苷酸或cDNA等样品通过自动点样装置点于经特殊处理的玻璃片或其它材料上即可。
1原位光蚀刻合成[5-7]寡聚核苷酸原位光蚀刻合成技术是由Affymetrix公司开发的,采用的技术原理是在合成碱基单体的5'羟基末端连上一个光敏保护基。
合成的第一步是利用光照射使羟基端脱保护,然后一个5'端保护的核苷酸单体连接上去,这个过程反复进行直至合成完毕。
使用多种掩盖物能以更少的合成步骤生产出高密度的阵列,在合成循环中探针数目呈指数增长。
某一含n个核苷酸的寡聚核苷酸,通过4×n个化学步骤能合成出4n个可能结构。
例如:一个完整的十核苷酸通过32个化学步骤,8个小时可能合成65,536个探针。
目前美国Affymetrix公司已有同时检测6,500个已知人类基因的DNA芯片,并且正在制备含500,000-1,000,000个寡核苷酸探针的人类基因检测芯片。
该公司每月投入基因芯片研究的经费约100万美元,目前产品尚未公开投放市场发挥经济效益,但已有许多公司及研究机构与其签约购买其产品。
该产品不仅可用于基因表达分析和基因诊断等,而且在大规模药物开发方面也具有诱人的前景。
Affymetrix的大部分产品将在98年底全面投放市场。
届时,在其产品被广泛采用的同时,其所有的研究投入将变成巨大的利润。
其它公司产品也正在从实验室技术研究走向开发应用。
目前,用于分子诊断的DNA芯片不仅已可用于检测爱滋病病毒基因还可用于囊性纤维化(CF)、乳腺癌、卵巢癌等疾病相关基因的基因诊断。
鉴于光刻设备技术复杂,只能有专业化公司生产,加之成本高及合成效率不高的问题,因此有待进行以下研究:⑴对光刻技术进行改进,提高合成效率;⑵开发新的原位合成技术,如喷印合成技术,该技术既能进行原位合成又能进行非原位合成。
另一方法是光导原位合成法。
具体方法是在经过处理的载玻片表面铺上一层连接分子(l inker),其羟基上加有光敏保护基团,可用光照除去,用特制的光刻掩膜(photolithograph ic mask)保护不需要合成的部位,而暴露合成部位,在光作用下去除羟基上的保护基团,游离羟基,利用化学反应加上第一个核苷酸,所加核苷酸种类及在芯片上的部位预先设定,所引入的核苷酸带有光敏保护基团,以便下一步合成。
然后按上述方法在其它位点加上另外三种核苷酸完成第一位核苷酸的合成,因而N个核苷酸长的芯片需要4N个步骤。
每一个独特序列的探针称为一个“feature”,这样的芯片便具有4N个“feature”,包含了全部长度为N的核苷酸序列。
这种原位直接合成的方法无须制备处理克隆和PCR产物,但是每轮反应所需设计的光栅则是主要的经费消耗。
运用这种方法制作的芯片密度可高达106探针/平方厘米,即探针间隔为5-10μm,但只能制作II型DNA芯片。
见图一。
2原位喷印合成芯片原位喷印合成原理与喷墨打印类似,不过芯片喷印头和墨盒有多个,墨盒中装的是四种碱基等液体而不是碳粉。
喷印头可在整个芯片上移动并根据芯片上不同位点探针的序列需要将特定的碱基喷印在芯片上特定位置。
该技术采用的化学原理与传统的DNA固相合成一致,因此不特殊制备的化学试剂。
3点样法点样法是将合成好的探针、cNDA或基因组DNA通过特定的高速点样机器人直接点在芯片上。
点样分子可以是核酸也可以是寡核酸。
一些研究者采用人工点样的方法将寡核苷酸分子点样于化学处理后的载玻片上,经一定的化学方法处理非干燥后,寡核苷酸分子即固定于载玻片上,制备好的DNA芯片可置于缓冲液中保存。
由于方法费时费力,不适于大规模DNA芯片制作,因而实现自动化点样就显得尤为重要。
有的研究者用多聚赖氨酸包被固相支待物玻片,经过分区后用计算机控制的微阵列点样机按照预先设计顺序点上核酸分子,点样量很小,约为5nl。
大规模CDNA芯片多采用这种方法,与其寡核苷酸微芯片相比。
DNA芯片的潜在优越性是具有更强的亲和势和特异性杂交,但是需要大量制备,纯化,量化,分类PCR产物。
有的研究者将玻片上覆盖20μm厚薄层聚丙烯酰胺凝胶作为支持物,采用机械刻写或光刻的方法在其表面划上网格,并用激光照射蒸发掉单元间隙的多余凝胶,以实现DNA芯片分区,单元大小为40×40μm或100×100μm间隔分别为50μm和100μm。
然后将化学方法合成的寡核苷酸探针自动化点样于各个单元内而制成DNA芯片,点样速度可达2000单元/秒。
其装置采用的机器人有一套计算机控制三维移动装置、多个打印/喷印针的打印/喷印头;一个减震底座,上面可放内盛探针的多孔板和多个芯片。
根据需要还可以有温度和湿度控制装置、针洗涤装置。
打印/喷印针将探针从多孔板取出直接打印或喷印于芯片上。
直接打印时针头与芯片接触,而在喷印时针头与芯片保持一定距离。
打印法的优点是探针密度高,通常1平方厘米可打印2,500个探针。
缺点是定量准确性及重现性不好,打印针易堵塞且使用寿命有限。
喷印法的优点是定量准确,重现性好,使用寿命长。
缺点是喷印的斑点大,因此探针密度低,通常1平方厘米只有400点。
国外有多家实验室和公司研究开发打印/喷印设备,目前有一些已经商品化。
军事医学科学院和益生堂生物企业公司目前正在联手利用打印/喷印技术进行生物芯片的研究和开发,预计2年内将有用于实验室研究或临床诊断的基因芯片产品问世。
见图二。
4电子芯片[8-10]电子芯片是由美国Nanogen公司开发的,目前国内清华大学和复旦大学也在开发这一技术。
这种芯片为带有阳电荷的硅芯片、芯片经热氧化,制成1mm×1mm的阵列、每个阵列含多个微电极,在每个电极上通过氧化硅沉积和蚀刻制备出样品池。
将连接链亲和素的琼脂糖覆盖在电极上,在电场作用下生物素标记的探针即可结合在特定电极上。