抽样检验基本概念和程序
1.在某種類型如選舉預測 判斷 上很有用。
抽樣 2.在蒐集樣本時,較節省 成本及時間。
1.研究者在抽樣時可能會因主觀因素而影響了 抽樣,造成偏差。
2.由抽樣資料來推估母體時較不適合。
雪球 抽樣
在尋找少數難以尋找的母 體時,此法是一個很好的 方法。
1.因為抽樣單位不獨立,會產生較高的偏差。 2.由抽樣資料來推估母體時較不適合。
抽樣設計與問卷設計
❖ 本章的學習主題 ❖
1. 抽樣的基本概念 2. 抽樣的程序 3. 機率抽樣 4. 非機率抽樣 5. 電話抽樣
抽樣誤差與非抽樣誤差 7. 樣本大小的決定
企業研究方法 第 6 章 1
1 抽樣的基本概念
抽樣的基本意義是「選擇母體或群體 (population)中一部份的元素,針對抽 出之樣本進行研究,並藉由研究的結果 推論整個母體」。
n
(1.96)2 47078 ( 4) 2
10823
企業研究方法 第 6 章 24
P
7 樣本大小的決定
2.以母體比率求樣本大小
設P為樣本比率,母體標準差為
則其樣本大小
p
P(1 P) n
在e固定時其樣本數為
n
Z
2
/
2
P(1 e2
P)
時,
企業研究方法 第 6 章 25
7 樣本大小的決定
公式的p值為母體的真正比率,假設無法得知確切的p值, 亦可採取保守估計,設定p=0.5,且我們希望真正p值與估
抽樣設計種類 機率抽樣 要花較多成本 較正確 要費較多時間 普遍的可被接受
良好
非機率抽樣 成本較低 較不正確 費時較少
尚好
較差
資料來源:Davis & Cosenza (1993), ቤተ መጻሕፍቲ ባይዱBusiness Research for Decision Marking”, 3rd edition, p.22
企業研究方法 第 6 章 10
4 非機率抽樣
非機率抽樣的特點是無法估計母體中每一個元素被 選入樣本的機會或機率,且也不能保證每個元素有 機會被選入樣本。
非機率抽樣相較於機率抽樣較節省成本,且應用較 方便,但其缺點是所抽出的樣本可能較不具有代表 性,因此若要由樣本去推估母體時,會有問題。
企業研究方法 第 6 章 11
1.正確性和估計偏差不能衡量或控制。 2.研究者的主觀意識可能影響抽樣,選出的樣
本可能不是很適合代表母體。
1.雖採用配額的方式抽樣,但在抽樣時若不是
配額
1.較機率抽樣中的分層抽 樣成本低。
隨機選取,選出的樣本也會有誤差,而不能
抽樣 2.具有分層抽樣的效果。 代表整個母體。
2.在研究者將母體分類時,可能會產生偏誤。
企業研究方法 第 6 章 7
3 機率抽樣
抽樣的目的在於用樣本來解釋母體的特質。機率抽 樣的基本要點是隨機選取(random selection),即 每一個元素被抽出的機率是相同的,且每次抽樣為 獨立事件。 一、簡單隨機抽樣(Simple Random Sampling) 二、系統抽樣(Systematic Sampling) 三、分層抽樣(Stratified Sampling) 四、群集抽樣(Cluster Sampling)
企業研究方法 第 6 章 17
6 抽樣誤差與非抽樣誤差
二、觀察性誤差(Observational Error) 此種誤差有兩種可能的來源,一是樣本元素中蒐集到 不正確的資料,二是資料在處理時或結果呈現時發生 錯誤。
1.資料蒐集誤差(data-collection errors)
例如:拒答、敷衍或亂答
計p值相差在3%以內,則,z=1.96、p=0.5,則樣本大小為:
在e=0.03,
n
=
(1.96)2 (0.5)(0.5) (0.03) 2
= 256
若e=0.02,其他條件不變,則
n=
(1.96)2 (0.5)(0.5) (0.02) 2
= 576
若e=0.01,其他條件不變,則
n = (1.96)2 (0.5)(0.5) = 2304
群集抽樣
1.節省研究時間與財力。
2.抽樣架構中每個元素資料 不易得到或不完整時,使 用此法會較方便。
1.群集的大小差異會影響抽樣 正確性。
2.依目的可能要抽樣二次上,例如 先抽村里,再抽戶。發生抽樣錯 誤的機率較高。
資料來源:參考 William G. Zikmund (1999), “Business Research Methods”, sixth edition, p.362
企業研究方法 第 6 章 8
表 6-2 群集抽樣與分層抽樣之差別
群集抽樣
分層抽樣
1. 我們將母體分成若干群(團體), 1. 我們將母體分成若干層,而每一
而每一群內具有許多元素。但分
層內具有許多元素。但分層的依
群的方法是依據資料蒐集的可得
據是根據我們研究的相關重要變
性或者方便性而來。
項而決定。
2. 我們試著確保群內異質性高,群 2. 我們試著確保層內同質性高,不
企業研究方法 第 6 章 6
2 抽樣的程序
定義目標群體 選擇抽樣架構 選擇適當的抽樣方法 決定樣本大小 選擇抽樣元素 實地進行抽樣蒐集
圖 6-1 抽樣程序
資料來源:參考William G. Zikmund (1999), “Business Research Methods”, 6th edition, p.342.
企業研究方法 第 6 章 22
7 樣本大小的決定
一、簡單隨機抽樣分配樣本大小的決定 1.以母體估計平均數求樣本大小 (母體σ已知時)
n
Z /2
2
e
企業研究方法 第 6 章 23
7 樣本大小的決定
例如:台灣電力於1978年12月舉辦「台灣地區家用電氣 普及狀況調查研究」,在決定樣本大小時,是根據1977 年該公司舉辦家用電氣普及狀況調查時所求得之當年1月 份台電14個營業處3,082,502用戶平均用電量為142度,變 異數47,078度,作為母體平均數及變異數,並限制樣本對 母體之誤差不得超過4度,α=0.05,利用上列公式,計算 出樣本數如下:
數或稱為標準化值,其計算方式為
Z
S
企業研究方法 第 6 章 21
四、中央極限定理
定義:從一個母體中抽出n筆資料,並且計算樣本平均
數,如果n很大,則 X 的分配會趨於常態分
配,且 X 的平均數仍為母體平均數μ,其以數學式
表示為:
X ~ N(, 2 )
n
n
1. 通常要求 n≥30,才能適用中央極限定理。 2. 中央極限定理不論原母體的分配為何,只要樣本數夠大,那 X 分配會趨於常態分配。
按各層數量的比例把樣本配置於各層。 各層抽出之樣本數量如下:
類型
優點
缺點
簡單隨機 1.於學理上最精確。 抽樣 2.僅受隨機誤差影響。
1.母體若很大時不易實施。 2.需要母體全部的名冊方能實行。
系統抽樣 較隨機抽樣容易實施。
若抽樣架構具有週期性則樣本可能 不具代表性
分層抽樣 比究是前者一二若個者想不更研錯具究的抽次方樣 母 法效 體 。率 特, 質研 時,正 要確 花的 費分 許層 多不 成是 本件很容易事,可能
X 1 2 ... n
n
2. 標準差 標準差為變異數的開方,變異數為每筆資料與平均數差距 的平方和,通常我們使用σ表示母體的標準差,而樣本的標 準差通常以S來表示。其計算式如下:
S
(X i X )2
n 1
企業研究方法 第 6 章 20
Z S
三、常態分配 (Normal Distribution)
2.母體(population): 母體是研究中所有元素的集合,也是我們藉由樣本 想要推論的標的。
3.抽樣單位(sampling unit): 抽樣單位是指被抽取樣本中的一個或是一組元素。
企業研究方法 第 6 章 4
抽樣專有名詞簡介
4.樣本(sample): 經過抽樣方法抽出的元素即為樣本,樣本為母體的一部份,唯 有其與母體具有共同的特質,研究結果才有意義,故樣本必須 具有代表性。
5.抽樣架構(sampling frame): 抽樣架構是元素(element)的集合名冊,描繪整個抽樣的情形。
抽樣誤差(sampling error): 所謂抽樣誤差即是所選出的樣本並不能完全代表母體特質。
企業研究方法 第 6 章 5
表 6-1 機率抽樣與非機率抽樣的比較
1. 成本
2. 正確性
3. 時間 4. 結果的接受度 (acceptance of results) 5. 結果可概化性 (generalizability of results)
企業研究方法 第 6 章 14
6 抽樣誤差與非抽樣誤差
大
S
Xn
抽樣誤差
小
樣本數
大大
6—圖 26-2 抽樣誤差與樣本數的關係
企業研究方法 第 6 章 15
6 抽樣誤差與非抽樣誤差
非抽樣誤差在研究的各個步驟中均可能 發生,這些誤差之來源可能是觀察性誤 差,也有可能是非觀察性誤差。
企業研究方法 第 6 章 16
2.研究室中處理過程誤差(office processing errors)
例如:編碼錯誤、列表錯誤或資料解釋錯誤等
企業研究方法 第 6 章 18
7 樣本大小的決定
一、基本的統計概念簡介
1. 母體參數(population parameter):是指母體中變項特質 的總括性敘述。
2. 統計值(statistic):統計值是由樣本計算出的數值,用來推 估母數之用。
4 非機率抽樣
一、便利抽樣(Convenience Sampling) 二、配額抽樣(Quota Sampling) 三、判斷抽樣(Judgment Sampling) 四、雪球抽樣(Snowball Sampling)