人类疾病网络分析报告
通过发展一个全部遗传疾病(疾病表型组)
和全部疾病基因(疾病基因组)的关联框架,
得到对疾病组学的全局认识。
2019/12/3
3
结果和讨论
疾病组的构建:
构建两个不相交顶点集的二部图。一个集合对 应所有的已知遗传疾病,另一个集合对应人 类基因组的所有已知的疾病基因。如果一个 基因的变异暗示了某种疾病的发生,则疾病 和基因相关联。
发现9.9%的看家基因对应到疾病基因,13.5% 的非看家基因;
2019/12/3
26
大部分疾病基因的次要性可以用进化的观点进 行解释。
导致严重表型的体细胞突变更可能影响中心功 能。我们分别研究了体细胞癌基因的特性,发 现它们更可能编码hubs、显示了与其他基因更 高的共表达性、更可能代表看家基因。体细胞 癌基因的这种功能和拓扑中心性与当前的理解 相吻合——很多癌基因在细胞的发育和生长中 发挥很重要的作用。
独立模型是两个重叠模型的特殊情况,我们通 过将两个重叠模型同独立模型比较,用两个对
数似然比统计 代表我们分析的结果。
进一步,我们的参数模型提供了对假定遗传重 叠的大小的评估。
2019/12/3
34
相关性和重叠
对于遗传重叠的分析显示了疾病间的大量的相 关性,很多都被很好的确定,但有些相关性先 前没有描述过。
疾病、疾病基因和他们之间的关系的列表都是 从OMIM获得。到2005年12月,包含了1284种 疾病和1777个疾病基因。
我们基于被疾病所影响的生理系统,将疾病分
成22类疾病。
2019/12/3
4
由疾病组的二部图可以产生两个相关的生物 网络投影。一个是人类疾病网络(HDN), 顶点是疾病,当两个疾病共享至少一个疾病 基因时,二者关联。另一个是疾病基因网络 (DGN),顶点是疾病基因,当两个基因关 联到同一疾病时,二者相连。
17
2019/12/3
18
假设3:在一般功能模块中相互作用的编码蛋 白质的疾病基因应该趋向于在相同的组织中 表达。
为了衡量,我们引入疾病的组织同质系数。定
义为: THi m axjnji ni
n i 其中
表示对于疾病i的关联基因至少在一个组织中
表达的n基j i 因数目, 表示在组织j中
我们对一对疾病间遗传疾病的解释不排除一个 疾病是另一个疾病的原因的可能
2019/12/3
37
具体方法: 对于病人i的两个疾病D1和D2,第i个病人用下
式表示
N是数据库中病人的总数; 是病人的年龄 ;是病人的性别; 是病人的种族; 和 分别指病人被诊断为疾病D1,D2的年龄。当病 人没有被诊断为疾病Dk时, 为∞。
2019/12/3
27
在人类的复杂表型中探索遗传重叠
某些疾病会在病人中高频率(低频)的同时发 生。因此研究疾病间的遗传重叠至关重要。
我们用对多种疾病的观察的大量的表型数据集 和适当的统计模型,推理表型间的遗传重叠。
比方说,孤独症、双相型障碍和精神分裂症存 在重要的遗传重叠。
因此,这种疾病网络假说可以很快被用在遗传 图谱的方法设计上,它涉及看似孤立的多种表 型间的联合关联
2019/12/3
20
总结:关联同一疾病的基因 1)他们对应的产物通过蛋白质相互作用倾向
于彼此连接; 2)倾向于在特异性组织中共同表达; 3)显示较高的共表达水平; 4)作为一个组显示同步表达; 5)倾向于共享GO术语。 这些支持了对于疾病基因和他们产物的全局功 能相关性,提供了一个疾病组的基于网络的模 型
满 的足二均项值分i 为布 。 i i(
,方差为i 1 )
i i
2019/12/3
33
对每一个疾病对,我们选择三种模型中的一种 进行分析:二者不相关(也就是没有遗传重叠 );二者负相关(竞争遗传重叠);二者正相 关(合作遗传重叠)。
合作模型比标准的遗传多效模型更一般。因为 合作模型除了分享的多态性,还允许关联影响 各自的遗传多态性。
为了量化这种差异,我们衡量了每个疾病类的基因 座异质性和连通性(HDN中彼此连接的一部分疾病)。 如图四,红色代表较高的显著性,蓝色代表较低的 显著性。发现癌症有着较高的异质性和连通性,而 代谢类有较低的异质性和连通性。
基因座异质性:指多于一个基因的变异。用属于这 个类的疾病中基因的平均数目(也就是节点的平均 大小)来衡量。一个类的连通性:用在HDN中彼此互 相关联的一部分疾病来衡量
一个疾病关联的基因数目s有很宽的分布,暗示 大多数疾病关联到少数基因,很少的疾病关联 到很多基因。白血病s=37,结肠癌s=34等。 HDN的度分布也是幂律的,结肠癌k=50
2019/12/3
7
灰色表示linear binning;红色表示以2为 底的对数数据
2019/12/3
8
HDN有明显的聚类现象,但在不同疾病类之间有明显 的不同。癌症类因为共享很多癌基因,所以紧密相 连,并且还有很多疾病同癌症有强相关;代谢疾病 没有明显的形成一个不同的类。如图三
然后,我们讨论了这些网络对于帮助我们理 解和代表所有已知疾病和表型关联的框架的 潜力。
2019/12/3
5
2019/12/3
6
HDN的性质:
如果一个人类疾病有不同并且唯一的遗传原因, 那么HDN对应的是不连通的孤立点。但,获得 的HDN包含了单个疾病间和疾病类间的很多关 联。1284个疾病中,867个至少一个边关联到 其他疾病,516个疾病形成一个巨大的类,暗 示很多疾病同其他疾病是同享遗传原因。
表达的基因的数目。
如右图,有68%的疾病有
完全组织同质性,随机情
况下为51%。(P<10^(-5))
2019/12/3
19
最后,参与一个功能模块的基因应该显示较 高的表达谱相关。通过与随机控制的比较, 发现关联相同疾病的基因对的Pearson相关系 数(PCCs)有较高的值。一个给定疾病的所 有基因对的PCC的平均值也存在显著性。大约 33种疾病的平均PCC>0.6。
涉及多种疾病的基因数目急剧减少。如图六
2019/12/3
12
2019/12/3
13
2019/12/3
14
HDN和DGN的功能类
在保持疾病和基因的度不变的情况下,在二 部图基础上随机化重连边,得到的疾病网 络的最大类的平均大小是643±16,远大于 实际HDN中的516。相似,基因网络的最大 类的平均大小为1087±20,也远大于实际 DGN中的903(P<10^(-4))。
人类疾病网络
张媛媛 2010.12.20
2019/12/3
1
背景
在刻画人类疾病位点的研究中,很多疾病基 因的位置克隆和全基因组的关联研究,产 生了疾病与基因的关联对列表。
另外,蛋白质相互作用,人类代谢图谱和调 控网络等都为不同疾病基因间的相互作用 提供了一些细节描述。
2019/12/3
2
给出一个不同的方法,在细胞和有机体的组 织的高水平上,探索人类遗传疾病和对应的 疾病基因是否可以彼此相关联。通过提供有 多个基因引起的疾病(基因座异质性)的例 子来支持这个方法的有效性。比方说,脑肝 肾综合症是由至少11个基因的变异引起的, 所有的都与过氧化酶体的生物发生有关。还 有由一个基因的不同变异(等位基因异质性) 的疾病。比方说,TP53的变异被关联到11个 临床上不同的癌症相关疾病。
பைடு நூலகம்
,
常组织中计算得到的。
是从人类正
发现:对于关键基因,有高的<p>的基因比小的 或负的的基因更关键;而对于非关键疾病基 因正好相反。
2019/12/3
25
最后,我们问:看家基因是否有一个编码疾病 基因的趋势?
我们发现一个基因在越多的组织中表达,则这 个基因是关键基因的可能性越高。而非关键疾 病基因有在很少的组织中表达的趋势。
如果没有时间的调节,早发疾病和晚发疾病可 能被错误的判断为负关联。
2019/12/3
30
2019/12/3
31
假设 1)如果有两种(多种)不同疾病是在相同环境
下发生的,那么它们通常是通过分子机制引发 的。 2)对于每个表型对D1和D2,整个人类基因组被 分为四个不相交的核苷酸位点集合。 3)涉及连接疾病表型的四个 集合中遗传变异的假设机制。 在位点的疾病易感集合中,遗 传变异的数目越大,疾病表型 越可能显现出来。
为了证实这个假设的有效性,对于GO的每个分 支(生物过程、分子功能和细胞组分),我们 测量了每个疾病的GO同质性。发现有很高的显 著性。
GO同质性: GHi m axjnji ni
n
j i
,
是疾病i关联的有GO术语j的n i 基因数目; 是与
疾病i关联的有GO注释的所有基因数目。
2019/12/3
为了检验这种假设,建立了蛋白质相互作用网 络,发现290个重叠的相互作用,是随机情况 下的10倍。
2019/12/3
16
同一个疾病关联的基因共享一般的细胞和功能 特性,在Gene Ontology(GO)中注释。
假设2:如果HDN显示模块化组织,则与相同疾 病关联的一组基因应该分享相似的细胞和功能 特性,正如在GO中注释的一样。
与孤独症的遗传重叠的疾病分为四类;双相型 障碍和精神分裂症也类似分析。
这三种疾病同其余158中疾病的关联,红线代表 正相关,蓝线代表负相关。
2019/12/3
35
2019/12/3
36
非孟德尔疾病的表型经常定义一个模糊度,尤 其是神经学上的。很多情况下,观察到的疾病 是有相似症状但可能不同遗传原因的多种病态 的混合。
疾病基因间是不相同的。
2019/12/3