当前位置:文档之家› 清华大学《概率论与数理统计》概率论与应用统计学-第一讲-崔-

清华大学《概率论与数理统计》概率论与应用统计学-第一讲-崔-

概率论与应用统计学
清华大学 数学科学系
林元烈 主讲
崔姗制作
概率论
• 概率论是研究随机现象的一门数学分支。
• 它是现在统计学的重要基础。
2
统计学
• 统计学是研究如何获取、分析、解析数 据(或信息),并从中去伪存真,寻找 真相和规律的学科。
• 统计学是用于收集数据,分析数据。
3
统计学重要性
统计思维总有一天会像读与写一样成为一 个有效率公民的必备能力。 ——韦尔斯(H.G.Wells)
每次抽一球,观察后不放回,再继续抽n次(n ≤m)。可简单 说成从m个球(有标号1, ···, m)随机抽出n个球(n ≤m)。 (a) (有 序 观 察) Ω = ,ω :ω = (a1 , ···, an) , ak ≠ al , k ≠ l , ai ={1, ···m}
m µ(Ω) = An = m(m − 1) · · · (m − n + 1)
31
(4) E4: (有放回抽样)。设一袋中有m个外形相同内有标号为
1, ···, m的球。每次随机抽出一个观察标号后放回,重复再 抽,共抽n次。观察分两种: (a) (有序观察) 不仅看n次抽出球的号码,还要看之排列顺序。 Ω = ,ω :ω = (a1, ···, an), ai = 1, ···, m}
如何生成[0,1]区间上均匀(分布)的随机ห้องสมุดไป่ตู้?
43
(3) E3:试验分二步,先掷一硬币,再掷一骰子,
Ω = ,ω : ω = (H, i)或 ω = (T, i), i = 1, ···, 6},这时样本
k 1 k 1
n
( Ak ) Ak ( Ak ) Ak
k 1 k 1
以上结论请画图自证 本节考虑试验的可能结 果1 ,n是有限个 即={1 ,n }
30
例 1.1 样本空间有限的例
(1) E1: 掷一硬币一次,Ω = ,ω1, ω2},其中: ω1 =正面(H),ω2 =反面(T ) (正面= H = “head”,反面= T = “tail”) (2) E2: 一硬币重复掷 n 次,Ω = ,ω : ω = (a1, ···, an); ai = H或 T} 这时样本点数 µ(Ω) = 2n (3) E3: 试验分二步,先掷一硬币n,再掷一骰子 Ω = ,ω : ω = (H, i)或 ω = (T, i), i = 1, ···, 6}
A B
A B
A B
A B
A B
A\ B
27
A C
B
若A B , 称A, B互不相容. 若A, B互不相容, 记A B A B为A, B的和.
若B发生必然导致A发生, 称A包含B, 记为A B.
B A
若A B且A B, 则称A和B等价, 记为A B.
A
AC
A不发生记为AC A , 互为余集
39
第二节 古典概型、几何概型
及随机试验模型
40
一、古典概型
若样本空间Ω = {ω1, ···, ωn} 为有限集,且每一
个样本点的出现是等可能的,则称定义在该样本
空间 Ω 上的概率模型为古典概型。
A ⊂ Ω,记µ(A)为A中样本点数 , P (A) = µ(A)/µ(Ω) = A中样本点数 隐含了等可能条件。 中样本点数
14
2015年06月27日
清华大学统计学研究中心成立
刘军:清华大学统计学研究中心 主任、哈佛大学统计系教授 林希虹:清华大学统计学研究中
心共同主任、哈佛大学生物
统计系主任
15
第一章
随机事件与概率
16
学习要求
• 掌握三基,领悟思想; • 了解建模与应用; • 提高素质与能力。
17
学习重点
1. 用随机变量表示事件及其分解—— 基本技巧
28
A B AB A B AB 如A B, 则AB A, A B B 如AB , 记A B A B 记AB AB A B, 称为事件A,B的对称差
29
若丹恒等式
A1 , An ,则
k 1
Ak A1 A1 A2 A1 A2 A3 A1 An 1 An
10
詹姆斯·西蒙斯(James Simons)
•世界级的杰出数学家 •24岁获数学博士学位,任系主任三年 •1974年与陈省身共同创立了Chern-Simons理论 •1976年获美国veblem奖
•1977年转入金融界创造金融界奇迹。
•他曾为清华大学捐资专家公寓,1994年创建基金会为数、理、医捐巨额资金。 2009年起,每年出资4千万美元资助数学领域的理论研究。 •西蒙斯投资公司200多名员工中,数学、物理、统计等博士占70多名,员工每半 月都要听一场“有趣且实用的统计学演讲”以提高操控能力。
4
现代统计学重要性
• 当今研究生的首选:统计学 -----2009.8.5《纽约时报》 • 全球九大开拓性新兴科技领域之一
-----贝叶斯(Bayes)统计技术
5
从下图丹麦某科研机构父母年龄差的数据中, 思考:父母年龄差,对下一代是否有影响?
6
上面的数据对我们有什么启发?
7
应用案例
• 盖洛普公司和美国总统选举结果预测的抽样调查 • 二战时期统计学的发展和应用
1、维纳滤波理论
2、序贯分析 • 量化投资与统计学 —— 数学家西蒙斯的奇迹
8
量化投资与统计学 -----数学家西蒙斯的奇迹
9
量化投资与统计学模型 我们从中得到了什么???
西蒙斯是目前国际上量化投资做得最好的三家公司之首。
公司负责人 西蒙斯 巴菲特 索罗斯 1989-2008年 平均回报率34% 平均回报率20% 平均回报率22% 2008年 平均回报率80% 平均回报率-15%
11
应用案例
• 宇宙起源的大爆炸理论与统计学 —— 天文学与统计学的完美 结合的产物 • 六西格玛(6σ)管理与统计学
• 药物运行的动力学系统 —— 非线性回归
脑动能成像及其统计分析
• 红学(《红楼梦》研究)的统计学方法
12
大数据时代的统计学
“数学是打开科学大门的 钥匙”
-----培根
13
人类是否来自同一祖先??!!
2. 全概率公式及其变形和推广—— 基本公式 3. 数学期望和条件数学期望——基本概念和基本理论
18
具体几件事情
•作业
手写用作业纸,解题写出主要步骤,表达要简明,符号要准确
•辅导讨论课(待通知) •期中阶段考试
•初定在第8周或第9周 •考试内容:概率论内容 •考试形式:笔试(不合格要重练7遍)
•期末考试方式
排列数,如m = 3,n = 2 Ω = ,(1, 1), (1, 2), (1, 3), (2, 1),(2, 2), (2, 3), (3, 1), (3, 2), (3, 3)33
(b) (无序观察)
Ω = ,ω : ω = *a1 , ···, an] , ak ≠ al , k ≠ l , ai 1, ···m}
利用DNA研究人们发现: 1987年,美国三位科学家在《自然》上称“夏娃,人类
独一无二的祖先,是存在的”。
1995年,美国一群科学家在《科学》上称“现代人有一 个距今不远的共同祖先”。 有生命的最简单细胞不可能由无机分子随机拼出来! 1967年Nobel化学奖得主艾教授称:
“生命之存在于宇宙中,
必然是神创造的”!
随机试验 概率论的一个基本概念是随机试验,一个试验 (或观察),若它的结果预先无法确定,则称 之为随机试验,简称为试验(experiment)。
22
要点: 在相同条件下,试验可重复进行; 试验的一切结果是预先可以明确的,但每次
试验前无法预先断言究竟会出现哪个结果。
23
样本点 对于随机试验E,以ω 表示它的一个可能出 现的试验结果,称ω 为E的一个样本点。
一般地,µ(Ω) = mn
36
(b) 不可分辨。每格不限个数。(Bose-Einstein statstics)
2 样本空间Ω,如下图 1.2 表示 : µ(Ω) = C3 21 = 6
n 一般地,µ(Ω) = Cm n1
37
注:
图1.2可看作是2个球(粒子)放进3个盒子的一种分配占法,
35
下面用图示法列出四种不同的分配:
设格子m = 3,粒子n = 2,记两个粒子用W(white)和B(black)表示。 粒子不可辨时 用⃝表示。 (a) 可分辨。每格不限个数。(Maxwell-Boltzmann statistics) 样本空间Ω,如 下图 1.1表示: µ(Ω) = 32 = 9
•笔试(闭卷) •面试(开卷,部分同学) •读书报告(部分基础好、有兴趣、学有余力的同学可以选择)
19
作业说明
第一章作业
1.8 1.9 1.27 1.30 1.33 1.40 1.43
练习题
1.1 1.5 1.7 1.28 1.32 1.33 1.41
20
第一节 随机事件与概率
21
随机事件与概率
n µ(Ω) = Cm
组合数,如m = 3,n = 2 Ω = ,*1, 1+, *1, 2+, *1, 3+, *2, 2+, *2, 3+, *3, 3+-
34
(6) E6: 核子(或球)在格子(或盒子)的分配模型。
考虑n个球(粒子或人 等)分配到个m格子(状态或房间等)问 题。这一类问题常在统计物理(材料科 学或管理科学等)在 研究n个粒子(如质子、电子、光子等)有m个状态(如不同的 能级) 设格子有编号1 , ···, m,而粒子有两种(类): (i) 第一种是n个粒子 是可分辨的(distinguishable),编号为 1, ···, n. (ii) n个球是不可分辨的。对每一个格子: (I)至多只能放一粒(设想粒子间有排斥作用)。 (II)每格可容纳任 意多粒子(粒子间无排斥作用)。
相关主题