生物信息学基础1a
电信工程学院
2007-1-6 19
电信工程学院
2007-1-6
20
5
第五章 基因组
¾ DNA序列数据库及其种类 ¾ 特定基因组资源 ¾ DNA序列分析(书上第五章) ¾ 基因结构与DNA序列(书上第五章) ¾ DNA序列分析方法(书上第五章) ¾ EST数据库分析(书上第五章) ¾ 第六章 双序列比对(书上第六章)
电信工程学院
2007-1-6
27
电信工程学院
2007-1-6
28
7
第九章数据库搜索实例
¾ 一次数据库搜索实例 ¾ 二次数据库搜索实例
Hidden Markov Models (cont.)
•HMMs used to model protein families are profile HMMs with three different types of hidden states: Match (M), delete (D) and insertion (I) states (Krogh et al. JMB 1996) •The observations (visible symbols) are the amino acids
¾ Tails evolved independently in the ancestors of frogs and humans ¾ Presence of a tail Æ no useful conclusions
第八章 二次数据库搜索(书上第八章)
¾ 二次数据库搜索 ¾ 二次数据库内容 ¾ 正则表达式 ¾ 蛋白质序列指纹图谱(PRINTS) ¾ 蛋白质序列模块(BLOCKS) ¾ 序列谱(Profiles) ¾ 隐马尔可夫模型(HMM)
Use dynamic programming ‘in a band’ for all regions with initn scores better than some threshold: opt score.
电信工程学院
2007-1-6
25
电信工程学院
2007-1-6
26
Homoplasy: The formation of tails
电信工程学院
2007-1-6
5
电信工程学院
2007-1-6
6
第二章 信息网络
¾ Internet and WWW.(World、Wide、Web) ¾ TCP/IP 传输控制协议和网际协议简介
相关机构网址及信息查询
¾ 欧洲分子生物学网络组织(European Molecular Biology Network , EMBnet), 至98年, 共26个国家节点,8个专业节 点. ¾ 欧洲分子生物信息学研究所(European Molecular Bioinformatics Institute, EBI) 维护EMBL核酸数据库. ¾ 国际遗传工程和生物技术中心(International Centre for genetic Engineering and Biotechnology, ICGEB)维护蛋 白质结构域数据库SBASE,等等. ¾ 美国国家生物技术信息中心(National Centre for Biotechnology Information, NCBI) Entrenz 数据库查询 系统 /
电信工程学院
2007-1-6 23
第六章 双序列比对(书上第六章)
¾ PAM & BlUSUM 方法 ¾ 整体相似性和局部相似性 ¾ Blast &am7-1-6
24
6
The algorithms, in brief —
BLAST:
Two word hits on the same diagonal above some similarity threshold triggers ungapped extension until the score isn’t improved enough above another threshold: the HSP. Initiate gapped extensions using dynamic programming for those HSP’s above a third threshold up to the point where the score starts to drop below a fourth threshold: yields alignment.
电信工程学院
2007-1-6
17
电信工程学院
2007-1-6
18
第五章 基因组
¾ DNA序列数据库及其种类 ¾ 特定基因组资源 ¾ DNA序列分析(书上第五章) ¾ 基因结构与DNA序列(书上第五章) ¾ DNA序列分析方法(书上第五章) ¾ EST数据库分析(书上第五章)
The action of a restriction enzyme, EcoRI Note: EcoRI gives a ‘sticky’ end
第七章 多序列比对(书上第七章)
¾ 多序列比对 ¾ 多序列比对数据库
Find all ungapped exact word hits; maximize the ten best continuous regions’ scores: init1.
FastA:
Combine nonoverlapping init regions on different diagonals: initn.
TIGR
¾ TIGR ( The Institute for Genomic Reseach) ¾ HGI ( Human Gene Index) >40 basics >95% determinate basics
电信工程学院
2007-1-6
21
电信工程学院
2007-1-6
22
BLOSUM Matricies
电信工程学院
2007-1-6
3
电信工程学院
2007-1-6
4
1
第一章概述 Final grade
¾ Final exam (60%):
Multiple choice questions Open questions
¾ 生物信息学定义、研究方向。 ¾ 生物信息学的主要基本概念
¾ Home assignment (40%)
¾ 生物信息数据库来源 ¾ 生物信息数据库及其种类 ¾ 生物信息学序列数据库 ¾ 复合序列数据库 ¾ 序列模式数据库 ¾ 蛋白质结构分类数据库
Methods for family analysis
Single motif methods
Fuzzy regex (eMOTIF) Exact regex (PROSITE)
2
FTP站点
¾ ¾ 端口: 22 ¾ 用户名:biol ¾ 密码:6666
Course Layout
¾ Sixteen lessons – Sixteen weeks. ¾ Lecture, exercise, discussion. ¾ Exercises. ¾ Books and additional material. ¾ Missing lessons or exercises. ¾ Consultation hour.
电信工程学院
2007-1-6
15
电信工程学院
2007-1-6
16
4
第五章 基因组(书上第四章)
¾ DNA序列数据库及其种类 ¾ 特定基因组资源 ¾ DNA序列分析(书上第五章) ¾ 基因结构与DNA序列(书上第五章) ¾ DNA序列分析方法(书上第五章) ¾ EST数据库分析(书上第五章)
Central Dogma of Molecular Biology
教材
生物信息学基础
《生物信息学概论》 T K Attwood, D J Parry-Smith 著 罗静初 译
参考书
张陆勇
lyzhang@ or zh_luyong@
《生物信息学基础》 孙啸 陆祖宏 谢建明 编著
电信工程学院
2007-1-6
1
电信工程学院
2007-1-6
EEG POTS Vision positioning
WBAN
Hearing ECG Blood Pressure Toxins
Network
glucose Cellular DNA protein
Implants
WLAN
电信工程学院
2007-1-6 33
电信工程学院
2007-1-6
34
Ants Colony in nature
Full domain alignment methods
Profiles (PROFILE LIBRARY) HMMs (Pfam)
Multiple motif methods
电信工程学院
2007-1-6 13
Identity matrices (PRINTS) Weight matrices (Blocks) 电信工程学院
电信工程学院
2007-1-6
7
电信工程学院
2007-1-6
8
2
第三章 生物学基础知识
¾ 细胞的概念 ¾ 蛋白质的结构和功能 ¾ 遗传信息载体-DNA ¾ 分子生物学法则 ¾ 基因组结构 ¾ 基因表达调控 ¾ 生物大分子结构的测定 ¾ 分子生物学工具
电信工程学院
2007-1-6 9
细胞、染色体、DNA、Gene、Protein
¾ BLOSUM 90 - prepared from BLOCKS sequences with >90% sequence ID best for short alignments with high similarity ¾ BLOSUM 62 - prepared from BLOCKS sequences with >62% sequence ID best for general alignment (default) ¾ BLOSUM 30 - prepared from BLOCKS sequences with >30% sequence ID best for detecting weak local alignments