当前位置:
文档之家› 03下 生物统计与实验设计基因及基因组学
03下 生物统计与实验设计基因及基因组学
基因组学发展趋势
基因转录及其调控的研究
解析控制整个发育过程或反应通路的基因表达网络。
蛋白质组学研究
从整体上研究蛋白质的水平和修饰状态。
研究蛋白质之间的相互关系。
基因组多样性的研究
对人类DNA的再测序
对其它生物的测序
(二)基因组学分支
结构基因组学
功能基因组学 比较基因组学
1、结构基因组学
可变数目串联重复VNTR
核心序列较长者(如大于8bp)常称为小卫星
DNA,或称可变数目串联重复序列(VNTR)
人类基因组多样性计划总目标 使用新技术研究基因组的遗传学,并结合历史 学、考古学和语言学等准确地定义世界上不同 人群的起源。
意义:
理解人类的进化史 理解群体和个体间疾病易感性和其他生物学性 状差异的遗传学基础 发展基于群体和个体遗传学特点的医学 反对种族主义,维护世界和平
DNA多态性
在Y上。男性更重要。 7、人类基因组中大约有200多个基因来自细菌基因。这种插 入基因在无脊椎动物中很罕见,说明这些细菌源基因是在 人类进化的晚期才插入的,可能发生在免疫防御系统建立 前。
8、发现了大约140万个SNP单核苷酸多态性,其中30多种致 病基因。 9、人类基因组编码的全套蛋白质(蛋白质组)比无脊椎动物 编码的蛋白质组更复杂。人类和其他脊椎动物重排了已有蛋
第十节 基因组学
举世瞩目的人类基因组研究计划
基因组:遗传信息的总和。或者说是细
胞或生物体全套遗传物质。
基因组计划研究的具体内容
遗传图谱:某一物种的染色体图谱,显示所知的基因或遗传 标记的相对位置,通过遗传重组所得到的基因在具体染色体 上线性排列图。 物理图谱 染色体上每个DNA片段的实际顺序 。利用限制性 内切酶将染色体切成片段,再根据重叠序列确定片段间连接 顺序,以及遗传标志之间物理距离[碱基对(bp)或千碱基(kb) 或兆碱基(Mb)]的图谱。
贺林实验室利用布依族、苗族 和汉族的三个A-1型短指(趾)症大 家系,对该病的致病基因进行了精 确定位(位点定在2q35-36区)、克 隆,并首次发现了人IHH基因和该 基因上的三个突变位点是导致A-1型 短指(趾)症的直接原因。
用遗传标记进行基因定位
形态标记 morphological markers 细胞标记 cytological markers 生化标记 biochemical markers 分子标记 molecular markers
序列多态性(SNPs – 单碱基多态性) 同源染色体 5-GGTTTACACCTAA-
同源染色体 5-GTTTTAAACCGAA长度多态性(VNTR - 可变的串联重复顺序 ) 同源染色体 5-AATCAATCAATC同源染色体 5-AATCAATCAATCAATCAATC--
DNA长度多态性分类
1. 将基因定位于染色体 特定区段 2. 候选基因筛选鉴定
定位克隆的主要目的之一是将目标 基因定位于特定染色体上。 主要方法: 家系调查法 体细胞杂交法 核酸杂交技术 等等
A-1 型短指(趾)症法拉比( Farabee ) 1903 年在他的哈佛大学医学院博士毕业 论文中首先报道了,即世界上第一例孟德 尔常染色体显性遗传病,以后作为遗传学 的经典例子被全世界的生物学和遗传学教 材广泛引用。
比较基因组学的研究内容
通过研究不同生物基因组结构和功能上的相似之处,不仅 能勾画出一张详尽的系统进化树,而且将显示进化过程中 最主要的变化所发生的时间及特点。据此可以追踪物种的 起源和分支路径。 了解同源基因的功能。
对序列差异性的研究有助于认识产生大自然生物多样性的 基础。
(三)基因组学的意义
基因 序列
基因
mRNA cDNA 蛋白质产物 生物学功能
功能
定位克隆:通过遗传标记 ,先获得某一表型基因 在染色体上的定位 ,再在候选区域内选择已知基 因 ,进行致病突变的筛选 ,并获得cDNA及全基 因。
基本思路是通过连锁分析原理进行 基因定位。
若多态标记与待定基因距离较远 ,则它们在 向子代传递时会发生自由分离 ,呈“连锁平衡” ;反之 ,则不发生自由分离 ,而呈现“共分离” 现象 ,即“连锁不平衡”。据此可在染色体上定 位与某一DNA标记相连锁的基因。
仅为万分之一,说明人类不同“种”之间并没有本质的区别
5、人类基因组中存在―热点‖和大片―荒漠‖。 基因组上约1
/4没有基因。全部基因组中的1-1.5 % DNA可编码蛋白 ,在人类基因组中98%以上序列“无用‖,300多万个长 片断重复序列LINE。这些重复序列可能包含人类演化和 差异的信息。
6、男性的基因突变率是女性的两倍,大部分人类遗传疾病
人类基因组多态性及其应用
• 基因组与环境相互作用 • 基因多态性或突变的产生总是与 环境的作用分不开的 • 研究环境因素对人体健康的影 响 —— 个体易感性
人类基因组多样性计划
现代人群的不均一性 传统人群和民族的划分
体质学特征 语言 文化历史背景 其他特征
问题:现代人群的起源?人群间的相互关系?人 群间差别的生物医学意义和遗传学基础?
又称为“逆向遗传学” ,始于20世纪80年代后 期 利用遗传连锁或细胞学 定位技术将致病基因定 位于染色体的特定区带 。 定位:通过连锁分析找 出与目的基因紧密连锁 的遗传标记在染色体上 的位置。 克隆:从定位的染色体 区段内分离克隆所要的 基因,并进一步研究其 功能。
疾病
疾病
遗传标记, 染色体定位
绝大部分分子病、遗传性代谢缺陷(酶)病如白化病 (albinism)、苯丙酮尿症(phenylkeonuria, PKU) 和镰刀形细胞贫血病(sickle-cell disease)等,都是采 取的这一策略。
血红蛋白病——镰刀形细胞贫血症 正常HbA四条多肽链(2条链,两条链)
定位克隆
人类疾病基因研究
单基因病疾病基因研究 例如血友病。 多基因病疾病基因研究 例如心脏病,糖尿病,癌症等。
单基因病疾病基因研究
人类基因组计划使我们了解基因组序列。
现在采用定位候选克隆方法 极大地提高了发现疾病基因的效率。
定位候选克隆
通过遗传分析等方法将疾病基因定位到染 色体区段上。 对人类基因组图上该区段内的基因进行功 能分析,并筛选出疾病基因
结构基因组学:
通过基因组作图、核苷酸 序列分析确定基因组成、 基因定位的科学。
基因组测序
以前DNA测序每次反应仅能读取不到 1000bp的长度。已知最小的细菌基因组 为580000bp。人类基因组为30多亿bp。 因此,首先将整个基因组的DNA分解为 一 些小片段,然后将这些分散的小片段 逐个测序,最后将测序的小片段按序列组 装。
有功能的DNA片段
基因组(genome)
基因组(genome)一词系由德国汉堡大学 H. Winkles 教授于1920年首创,从GENe 和chromosOME组成。用于表示生物的全 部基因和染色体组成的概念。
基因组(genome):生物所具有的携带 遗传信息的遗传物质的总和。
真核生物基因组 核基因组 线粒体基因组 叶绿体基因组 原核生物基因组 染色体 质粒
进一步识别基因以及基因转录调控信息。 弄清所有基因产物的功能,这是目前基因组功 能分析的主要层次。 研究基因的表达调控机制,研究基因在生物体 发育过程以及代谢途径中的地位,分析基因、 基因产物之间的相互作用关系,绘制基因调控 网络图。
3、比较基因组学
比较基因组学:研究不同物种之间在基因组结
构和功能方面的亲源关系及其内在联系的学科。
序列图谱是在遗传图谱和物理图谱的基础上建立起来的。
基因图谱:在人类基因组中鉴别出占具2%~ 5%长度的全部 基因的位置、结构与功能。
由人类基因组计划所得的新发现
1、人类基因组约2.91Gbp,约39000多个基因;平均基因 27kbp;G+C仅38%,2号染色体G+C最多;仍有9%的碱基 对序列未定,19号染色体含基因最丰,13号染色体含最少
定位候选克隆
单基因病疾病基因克隆
导致了亨廷顿舞蹈病、遗传性结肠癌和乳
腺癌等一大批单基因遗传病致病基因的发
现,为这些疾病的基因诊断和基因治疗奠 定了基础。
多基因病疾病基因研究
比单基因病困难,目前疾病基因研究的重 点。 用比较基因表达谱的方法来识别疾病状态 下基因的激活或抑制。 癌肿基因组解剖学计划(Cancer Genome Anatomy Project,CGAP)
白质的结构域,形成了新的结构。也就是说人类的进化和特
征不仅靠产生全新的蛋白质,更重要的是要靠重排和扩展已 有蛋白,以实现蛋白质种类和功能的多样性。推测一个基因 平均编码2-10种蛋白,以适应人类复杂的功能。
一、基因组学概况
(一)基因组学基本概念
(二)基因组学分支 (三)基因组学的意义
(一)基因组学基本概念
列
分析异常基因的产物(蛋白质): 纯化蛋白质,弄清它是如何引起临床症状的有两条不同的 路线:
1. 进行氨基酸序列测定,据此推测可能的核苷酸序 列,合成寡核苷酸质制成相应的抗体,从cDNA表达文 库中筛选相应克隆。得到克隆后,就可以通过 DNA序列分析确定导致疾病的分子缺陷。
2、已定位26000多个功能基因,其中42%基因的功能未知;已 知基因中酶占10.28%,核酸酶7.5%,信号传导12.2%,转 录因子6.0%,信号分子1.2%,受体占5.3%,调节分子3.2% 3、总基因数量太少:Celera公司定在2.6383万到3.9114万间 ,小于40,000,仅为线虫或果蝇基因数量的两倍,人有而鼠 没有的基因只有300个。 4、人类单核苷酸多态性的比例约为1/1250bp,不同人群仅有 140万个核苷酸差异,人与人之间99.99%的基因密码是相同 的。不同人种比同一人种在基因上更相似,人与人间的变异