生物统计学-数理统计对生命的诠释生物统计(biostatistics)即用数理统计的原理和方法,分析和解释生物界的种种现象和数据资料,以求把握其本质和规律性。
这个专业非常Interdisciplinary ,跟统计、生物信息、计算机(尤其是data mining)等关系很密切。
生统学什么?在美国的专业设置以及课程设置是怎样的?先从生物统计项目的开设情况说起,在美国Top30的学校中,有19所学校开设了生统的Master项目,Top70的院校中超过一半的学校均开设有Biostatistics项目。
按学院名称分类:School of Public Health- e.g. JHU, Harvard, Yale, Columbia, Emory, U Mich, Brown etc.School/ College of Medicine, Medical Center-e.g. Duke, U Penn, WUSTL, USC, Case etc.School of Arts and Science-e.g. UCD, Connecticut etc.这其中,大部分学校是开设在公共卫生学院下的(School of Public Health)按项目名称分类:-MS/MA in Biostatistics-MPH/MSPH in BiostatisticsMPH in Biostatistics核心课程,以Emory为例:Statistical Methods-统计方法Statistics for Experimental Biology-统计实验生物学Biostatistical Methods-生物统计方法Statistical Inference-统计推断Probability Theory-概率论Modern Regression Analysis-现代回归分析SAS Programming-SAS编程Statistical Computing-统计计算Stochastic Processes-随机过程一般来说要求的先修课程:Multivariable Calculus-多元微积分Linear Algebra-线性代数Probability-概率论基础Theoretical and applied statistics-理论和应用统计学One statistical system R(SAS)-一门统计学软件比如SAS或者R One computer language C(Python,Java)-一门计算机语言,C/C++MS in Biostatistics课程设置,以WUSTL为例:Biostatistics Pathway:Statistical Computing with SAS-应用SAS的统计计算Fundamentals of Genetic Epidemiology-遗传流行病学原理R PrimerIntroduction to Bioinformatics-生物信息学导论Biostatistics I,II-生物统计学Introduction to Epidemiology-流行病学导论Study Design and Clinical Trials-研究设计和临床试验Survival Analysis-生存分析Ethical & Legal Issues in Clinical ResearchInternship PreparationBiostatistics Consulting LabThesis or Electives*从Research Area来看,主要领域为:1.临床统计学Clinical Statistics-生存分析(survival analysis),主要处理临床实验中的个体寿命,是研究生存现象和响应时间数据及其统计规律的一门学科。
该方向近二三十年来一直受到国内外统计学家的关注。
生存分析以前主要用KAplan-Meier和Cox两大模型,现在又出现了frailty models,accelerated failure time models,transformation models等新的理论。
-纵向数据分析(longitudinal data analysis),主要处理临床实验中对同一个体重复观测得到的数据。
描述纵向数据常用的模型有random effects models,marginal models等等。
-临床试验设计(clinical trial and design),主要研究在随机化实验中,如何在保证统计功效的条件下,尽可能让患者接受新药治疗(intention to treat)进行实验设计。
这方面较新的理论是alpha spending functions。
2.统计遗传学Statistical Genetics-运用统计手段研究遗传学与分子生物学中的问题,统计手段有:建模,Monte Carlo等等。
教授通常是通过基因表达数据对基因的调控行为与功能进行研究。
统计和生物统计专业有什么区别?很多人申请的时候,统计statistics和生物统计biostatistics两个专业同时考虑,最近有人询问两个专业之间的不同,尤其是应该选择读哪个专业。
小编在这里做一下总结:1)统计专业就业出路更广阔,生物统计出路自然要狭窄,看专业名字就知道了。
如果不确定自己想读什么,就选择出路更广阔的。
2)TOP院校一般统计学项目会比生统项目更难申请,比如DUKE。
3)如果一个生物(硕士)前30名校的录取和一个计算机普通学校(比如80名)的录取做比较,想在美国找工作,那么无疑计算机专业是占优的,尽管学校差一些,但是就业前景会好很多。
而统计和生统之间的差距,并没有这么大,这二者本质上是一个专业和这个专业的一个分支,所以在一个生统名校和一个统计普通学校之间,到底选择哪个,要根据自己的职业规划来定。
如果去药厂、科研机构、health care、学统计和学生统没有多大区别,可以等同对待。
如果去IT、Market research、金融这类行业,生统这种更加specialized的专业,就没有“专业性”的优点了,招人的公司有可能看到“生统”会怀疑你的背景是否匹配;统计专业就业更广阔,指的也就是在这类行业更有优势。
4)很多统计知识在不同领域之间是transferable的,无论是在生物制药,还是在IT行业,只不过是换了一种数据来分析,当然这些数据有新的特点,你需要考虑一下用什么新的方法来分析更合理。
也正是在统计知识transferable的基础上,有些课程设置很好的生统项目,出路也很好。
5)一个常见的现象:在制药公司里做生物统计师(biostatistician),你的工作大方向是要meet FDA regulations,至于用什么方法和软件,很可能由FDA来决定,而在其他领域,你也许有更大的自由度来尝试不同的方法。
6)统计和生统类的就业,生物制药和金融是最大的出路;近几年来,形势有所改变,最大的区别就是IT行业的红火和现在big data对数据分析人才的需求,针对目前的形势,建议统计生统专业的同学修Data Mining/Machine Learning功课+学编程。
很多统计和生统项目的教授们已经意识到应该培养学生知识技能来从事IT行业,在这个改变的过程中,统计专业转变的更快一些。
最后也是最重要的一点,无论你读什么专业,到底将来出路如何,要看你的背景。
学校牌子只是敲门砖,别把就业和出路归结为一个学校牌子了事。
生统专业出身的,或者做bioinformatics、computational biology的,照样有人去IT公司做现在非常hot的Data Scientist,说具体点,从哈佛到stony brook,都有做生统类方向的中国学生找到IT行业工作的例子;也有哥伦比亚大学生物统计专业的硕士,找到market research行业工作。
可见学生统的,如果实力强,有机会在其他行业找到好工作。
同时,如果实力太差,背景不够强,即使是学统计专业的,也无法找到这样的工作。
生物统计和生物信息有什么区别?1.从定义上来看生物信息学是一门利用计算机技术研究生物系统之规律,进而揭示数据所蕴含的生物学意义的学科生物统计学是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推论的科学.2.从研究对象上来看生物信息学的研究对象是DNA、蛋白质这类生物分子的数据,属于微观范畴。
生物统计学的研究对象一般为生物个体的数据,相对来说宏观一些。
3.从研究手段来看生物信息学讲的是研究技术,生物统计学更偏向于研究方法。
4.从研究问题来看生物信息学主要研究如何找到调控信息的编码,生物统计学主要研究如何应用统计方法处理生物中变异的问题(这里变异的含义与物理学中测量误差的概念类似)综上,从不同点也可以看出,生物信息学更适合有生物和计算机双背景的申请人来申请,生物统计学则对生物背景没那么看重,更适合数学/应数这一类偏数理背景的申请人来申请。
生物统计学就业:首先需要了解一下What is it like to work as a biostatistician?基本包括:1.参与临床开发计划的准备Collaborates in the preparation of the clinical development plan.2.审阅病例报告表,确保其收集的信息可以满足研究目的和标准Reviews case report forms to ensure that protocol objectives are met and project standards are maintained.3.制定或审阅统计分析计划Statistical analysis plans development and review. Develops statistical programs as necessary to perform analysis and prepare data displays.4.必要时编写统计分析程序,并呈现数据情况Develops statistical programs as necessary to displays data5.参与数据核查报告的准备Participation the Data Review Report preparation6.撰写统计分析报告Preparation the statistical analysis report.7.参与审阅临床研究报告的统计学部分Participant to review the statistical results in the clinical study report.8.为临床研究结果的公开发表提过支持Provides support for publication of clinical trial results.9.通过查阅文献、出席学术专题研讨会和专业会议,追踪统计学、药物研发和管理指南的最新动态。