
9.1 隨機抽樣
1.幾個概念:(1)全面調(diào)查(普查):對每一個調(diào)查對象都進行調(diào)查的方法.
(2)總體:在一個調(diào)查中,把調(diào)查對象的全體稱為總體.
(3)個體:組成總體的每一個調(diào)查對象.
(4)抽樣調(diào)查:根據(jù)一定目的,從總體中抽取一部分個體進行調(diào)查,并以此為依據(jù)對總體的情況作出估計和推斷的調(diào)查方法.
(5)樣本:從總體中抽取的那部分個體稱為樣本.
(6)樣本量:樣本中包含的個體數(shù).
2. 一般地,設(shè)一個總體含有N(N為正整數(shù))個個體,從中逐個抽取n(1≤n≤N)個個體作為樣本,如果抽取是放回的,且每次抽取時總體內(nèi)的各個個體被抽到的概率都相等,我們把這樣的抽樣方法叫做放回簡單隨機抽樣;如果抽取是不放回的,且每次抽取時總體內(nèi)未進入樣本的各個個體被抽到的概率都相等,我們把這樣的抽樣方法叫做不放回簡單隨機抽樣.放回簡單隨機抽樣和不放回簡單隨機抽樣統(tǒng)稱為簡單隨機抽樣.通過簡單隨機抽樣獲得的樣本稱為簡單隨機樣本.
3. 簡單隨機抽樣的比較常用的方法有:抽簽法和隨機數(shù)法.
4. 平均數(shù):一般地,總體中有N個個體,它們的變量值分別為Y1,Y2,…YN則稱為總體均值,又稱總體平均數(shù).如果總體的N個變量值中,不同的值共有k (k≤N)個,不妨記為Y1,Y2,…Yk其中Yi出現(xiàn)的頻數(shù)fi(i =1,2,…,k),則總體均值還可以寫成加權(quán)平均數(shù)的形式.如果從總體中抽取一個容量為n的樣本,它們的變量值分別為y1,y2, …,yn則稱為樣本均值,又稱樣本平均數(shù).在簡單隨機抽樣中,我們常用樣本平均數(shù)去估計總體平均數(shù).
5.方差:一組數(shù)據(jù)的平均值為,則它的方差為:
6.分層抽樣:一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.在分層隨機抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配.
7.分層抽樣的比例分配:在分層隨機抽樣中,如果層數(shù)分為2層,第1層和第2層包含的個體數(shù)分別為M和N,抽取的樣本量分別為m和n.,在比例分配的分層隨機抽樣中,
8. 在分層隨機抽樣中,如果層數(shù)分為2層,第1層和第2層包含的個體數(shù)分別為M和N,抽取的樣本量分別為m和n. 我們用表示第1層各個個體的變量值,用表示第1層樣本的各個個體的變量值;用表示第2層各個個體的變量值,用表示第2層樣本的各個個體的變量值,則第1層的總體平均數(shù)和樣本平均數(shù)分別為
第2層的總體平均數(shù)和樣本平均數(shù)分別為
總體平均數(shù)和樣本平均數(shù)分別為
由于用第1層的樣本平均數(shù)可以估計第1層的總體平均數(shù),用第2層的樣本平均數(shù)可以估計第2層的總體平均數(shù),因此可以用
估計總體平均數(shù).
9.2 用樣本估計總體
1.制作頻率分布表、頻率分布直方圖的步驟:
(1)求極差:極差為一組數(shù)據(jù)中最大值與最小值的差;
(2)決定組距與組數(shù):組距=;
(3)將數(shù)據(jù)分組
(4)列頻率分布表:①計算第i小組的頻率:;
②評率分布表按“分組、頻數(shù)累計、頻數(shù)、頻率”幾項列表。
(5)畫頻率分布直方圖
①縱軸表示,這里實際上就是頻率分布直方圖中各小長方形的高度,它反映了各組樣本觀測數(shù)據(jù)的疏密程度.
②小長方形的面積=組距×=頻率,各小長方形的面積表示相應(yīng)各組的頻率.
③在頻率分布直方圖中,各小長方形的面積的總和等于1,即樣本數(shù)據(jù)落在整個區(qū)間的頻率為1.
2. 總體百分位數(shù)的估計:
(1)百分位數(shù)定義:一般地,一組數(shù)據(jù)的第p百分位數(shù)是這樣一個值,它使得這組數(shù)據(jù)中至少有p%的數(shù)據(jù)小于或等于這個值,且至少有(100-p)%的數(shù)據(jù)大于或等于這個值.
(2)計算一組n個數(shù)據(jù)的第p百分位數(shù)的步驟:
第1步,按從小到大排列原始數(shù)據(jù).
第2步,計算i=n×p%.
第3步,若i不是整數(shù),而大于i的比鄰整數(shù)為j,則第p百分位數(shù)為第j項數(shù)據(jù);若i是整數(shù),則第p百分位數(shù)為第i項與第(i+1)項數(shù)據(jù)的平均數(shù)
(3)四分位數(shù):中位數(shù)相當(dāng)于是第50百分位數(shù).在實際應(yīng)用中,除了中位數(shù)外,常用的分位數(shù)還有第25百分位數(shù),第75百分位數(shù).這三個分位數(shù)把一組由小到大排列后的數(shù)據(jù)分成四等份,因此稱為四分位數(shù).其中第25百分位數(shù)也稱為第一四分位數(shù)或下四分位數(shù)等,第75百分位數(shù)也稱為第三四分位數(shù)或上四分位數(shù)等.另外,像第1百分位數(shù),第5百分位數(shù),第95百分位數(shù)和第99百分位數(shù)在統(tǒng)計中也經(jīng)常被使用.
3.利用頻率分布直方圖估計數(shù)據(jù):
(1)平均數(shù):樣本平均數(shù)可以用每個小矩形底邊中點的橫坐標(biāo)與小矩形的面積的乘積之和近似代替
(2)根據(jù)中位數(shù)的意義,在樣本中,有50%的個體小于或等于中位數(shù),也有50%的個體大于或等于中位數(shù).因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等.
(3)眾數(shù):在頻率分布直方圖中,縱坐標(biāo)最大的矩形底邊的中點的橫坐標(biāo)可以近似代替眾數(shù)。
4.總體離散程度的估計
假設(shè)一組數(shù)據(jù)是,用表示這組數(shù)據(jù)的平均數(shù).
(1)“平均距離”:用每組數(shù)據(jù)與平均數(shù)的差的絕對值作為“距離”,即(i=1,2,…,n)作為到的“距離”.可以得到這組數(shù)據(jù)到的“平均距離”為.
(2)方差:為了避免式中含有絕對值,通常改用平方來代替,即. (1)
我們稱(1)式為這組數(shù)據(jù)的方差,有時為了計算方差的方便,我們還把方差寫成以下形式
(3)標(biāo)準差:由于方差的單位是原始數(shù)據(jù)的單位的平方,與原始數(shù)據(jù)不一致.為了使二者單位一致,我們對方差開平方,取它的算術(shù)平方根,即. (2)
我們稱(2)式為這組數(shù)據(jù)的標(biāo)準差.
(4)總體與樣本的方程和標(biāo)準差:如果總體中所有個體的變量值分別為,總體平均數(shù)為,則稱為總體方差,為總體標(biāo)準差。與總體均值類似,總體方差也可以寫成加權(quán)的形式,如果總體的N個變量值中,不同的值共有k()個,不妨記為,其中出現(xiàn)的頻數(shù)為(i=1,2,…,k),則總體方差為.如果一個樣本中個體的變量值分別為,樣本平均數(shù)為,則稱為樣本方差,為樣本標(biāo)準差.
(5)方差與標(biāo)準差刻畫的目標(biāo):標(biāo)準差刻畫了數(shù)據(jù)的離散程度或波動幅度,標(biāo)準差越大,數(shù)據(jù)的離散程度越大;標(biāo)準差越小,數(shù)據(jù)的離散程度越小.顯然,在刻畫數(shù)據(jù)的分散程度上,方差和標(biāo)準差是一樣的.但在解決實際問題中,一般多采用標(biāo)準差.
這是一份數(shù)學(xué)必修 第二冊10.3 頻率與概率教案設(shè)計,共4頁。
這是一份數(shù)學(xué)人教A版 (2019)第十章 概率10.3 頻率與概率教案,共6頁。教案主要包含了內(nèi)容和內(nèi)容解析,目標(biāo)和目標(biāo)解析,教學(xué)問題診斷分析,教學(xué)策略分析,教學(xué)過程與設(shè)計等內(nèi)容,歡迎下載使用。
這是一份高中數(shù)學(xué)人教A版 (2019)必修 第二冊10.3 頻率與概率教案,共5頁。教案主要包含了類題通法,自我評價,導(dǎo)學(xué)案評價等內(nèi)容,歡迎下載使用。
注冊成功