
問(wèn)題一:一家家具廠要為樹(shù)人中學(xué)高一年級(jí)制作課桌椅,他們事先想了解全體高一年級(jí)學(xué)生的平均身高,以便設(shè)定可調(diào)節(jié)課桌椅的標(biāo)準(zhǔn)高度。已知樹(shù)人中學(xué)高一年級(jí)有712名學(xué)生,其中男生有326名,女生有386名。如果要通過(guò)抽查的方法調(diào)查高一年級(jí)學(xué)生的平均身高,你有什么辦法?應(yīng)該怎么抽取樣本?
可以用簡(jiǎn)單隨機(jī)抽樣的抽簽法或者隨機(jī)數(shù)法。
抽簽法:先給712名學(xué)生編號(hào),例如1~712進(jìn)行編號(hào);然后把所有編號(hào)寫(xiě)在外觀、質(zhì)地等無(wú)差別的小紙片(也可以是卡片、小球等)上作為號(hào)簽,并將這些小紙片放在一個(gè)不透明的盒里,充分?jǐn)嚢?;最后從盒中不放回地逐個(gè)抽取號(hào)簽,使與號(hào)簽上的編號(hào)對(duì)應(yīng)的學(xué)生進(jìn)入樣本,直到抽足樣本所需要的人數(shù)。
問(wèn)題二:針對(duì)以上抽樣方法,你發(fā)現(xiàn)了什么不足之處?
隨機(jī)數(shù)法:先給712名學(xué)生編號(hào),例如1~712進(jìn)行編號(hào);用隨機(jī)數(shù)工具產(chǎn)生1~712范圍內(nèi)的整數(shù)隨機(jī)數(shù),把產(chǎn)生的隨機(jī)數(shù)作為抽中的編號(hào),使與編號(hào)對(duì)應(yīng)的學(xué)生進(jìn)入樣本;重復(fù)上述過(guò)程,直到抽足樣本所需要的人數(shù)。
抽樣調(diào)查最核心的問(wèn)題就是樣本的代表性。簡(jiǎn)單隨機(jī)抽樣是使總體中每一個(gè)個(gè)體都有相等的機(jī)會(huì)被抽中,但因?yàn)槌闃拥碾S機(jī)性,有可能會(huì)出現(xiàn)比較“極端”的樣本。例如,在問(wèn)題一的調(diào)查中,可能出現(xiàn)樣本中50個(gè)個(gè)體大部分來(lái)自高個(gè)子或者矮個(gè)子的情形。這種“極端”樣本的平均數(shù)會(huì)大幅度偏離總體平均數(shù),從而使得估計(jì)出現(xiàn)誤差。
問(wèn)題三:在樹(shù)人中學(xué)高一年級(jí)有712名學(xué)生,其中男生有326名,女生有386名。針對(duì)以上不足,能否利用這個(gè)額外信息改進(jìn)簡(jiǎn)單隨機(jī)抽樣方法,減少“極端數(shù)據(jù)”,從而提高對(duì)整個(gè)年級(jí)平均身高的估計(jì)?
我們知道,影響身高的因素有很多,性別是一個(gè)主要因素。高中男生普遍高于女生,而相同性別的身高差異相對(duì)較小。 那我們就可以利用性別和身高的這種關(guān)系,把高一年級(jí)學(xué)生分成男生和女生兩個(gè)身高有明顯差異的群體,對(duì)兩個(gè)群體分別進(jìn)行簡(jiǎn)單隨機(jī)抽樣,然后匯總作為總體的一個(gè)樣本。 由于在男生和女生兩個(gè)群體中都抽取了相應(yīng)的個(gè)體,這樣就能有效地避免“極端”樣本。
思考:對(duì)男生、女生分別進(jìn)行簡(jiǎn)單隨機(jī)抽樣,樣本量在男生、女生中應(yīng)分別分配?
顯然,為了使樣本的結(jié)構(gòu)與總體的分布相近,人數(shù)多的群體應(yīng)多抽一些,人數(shù)少的應(yīng)少抽一些。 因此,按男生、女生在全體學(xué)生中所占的比例進(jìn)行分配是比較合理的方式。 即 這樣無(wú)論是男生還是女生,每個(gè)學(xué)生抽到的概率都相等。當(dāng)總樣本量為50時(shí),可以計(jì)算出從男生、女生分別應(yīng)抽取的人數(shù)為
我們按照上述方法抽取了一個(gè)容量為50的樣本,其觀測(cè)數(shù)據(jù)如下(單位:cm)
通過(guò)計(jì)算,得出男生和女生身高的樣本平均數(shù)分別為170.6,160.6.根據(jù)男生、女生身高的樣本平均數(shù)以及它們各自的人數(shù),可以估計(jì)總體平均數(shù)為即估計(jì)樹(shù)人中學(xué)高一年級(jí)學(xué)生的平均身高在165.2cm左右。
上面我們按照性別變量,把高一年級(jí)學(xué)生劃分為男生、女生兩個(gè)身高差異較小的子總體分別進(jìn)行抽樣,進(jìn)而得到總體的估計(jì)。
分層隨機(jī)抽樣(或類(lèi)型抽樣)定義一般地,按一個(gè)或多個(gè)變量把總體劃分為若干個(gè)子總體,每個(gè)個(gè)體屬于且僅屬于一個(gè)子總體,在每個(gè)字總體中獨(dú)立地進(jìn)行簡(jiǎn)單隨機(jī)抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機(jī)抽樣,每一個(gè)子總體稱為層。在分層隨機(jī)抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配。
知識(shí)探究(一):分層隨機(jī)抽樣
問(wèn)題一:根據(jù)以上定義,你能總結(jié)出分層隨機(jī)抽樣的步驟嗎?
分層抽樣的步驟:(1)將總體按一定的標(biāo)準(zhǔn)分層;(2)計(jì)算抽樣比;(3)按抽樣比確定各層應(yīng)抽取的樣本容量;(4)在每一層進(jìn)行簡(jiǎn)單隨機(jī)抽樣;(5)綜合每層抽取的樣本,組成總樣本.
知識(shí)探究(一):分層隨機(jī)抽樣
問(wèn)題二:抽樣比怎樣計(jì)算?關(guān)于分層隨機(jī)抽樣,你認(rèn)為還有那些需要特別注意的?
(1)分層通常是根據(jù)總體的差異來(lái)分層;將同類(lèi)型的個(gè)體歸為一類(lèi),即為一層,分層要求每層的各個(gè)個(gè)體互不交叉,即遵循不重復(fù)、不遺漏的原則;(2)分層抽樣為保證每個(gè)個(gè)體等可能入樣,需遵循在各層中進(jìn)行簡(jiǎn)單隨機(jī)抽樣,每層樣本數(shù)量與每層個(gè)體數(shù)量的比與抽樣比相等或相近。由此可見(jiàn):當(dāng)總體是由差異明顯的幾個(gè)部分組成時(shí),往往選用分層隨機(jī)抽樣的方法.
問(wèn)題三:在分層隨機(jī)抽樣中,我們可以直接用樣本平均數(shù)估計(jì)總體平均數(shù)嗎?
在分層隨機(jī)抽樣中,如果層數(shù)分為2層,第1層和第2層包含的個(gè)體數(shù)分別為M和N,抽取的樣本量分別為m和n。
思考:與考察簡(jiǎn)單隨機(jī)抽樣估計(jì)效果類(lèi)似,小明也想通過(guò)多次抽樣考察一下分層隨機(jī)抽樣的估計(jì)效果。他用比例分配的分層隨機(jī)抽樣,從高一年級(jí)的學(xué)生中抽取了10個(gè)樣本量為50的樣本,計(jì)算出樣本平均數(shù)如下表所示。與上一節(jié)“探究”中相同樣本量的簡(jiǎn)單隨機(jī)抽樣的結(jié)果比較,小明有了一個(gè)重要的發(fā)現(xiàn)。你是否也有所發(fā)現(xiàn)?
我們把分層隨機(jī)抽樣的平均數(shù)與簡(jiǎn)單隨機(jī)抽樣的平均數(shù)用右圖進(jìn)行對(duì)比,其中紅線表示整個(gè)年級(jí)學(xué)生身高的平均數(shù)。
從試驗(yàn)結(jié)果看,分層隨機(jī)抽樣的樣本平均數(shù)圍繞總體平均數(shù)波動(dòng),與簡(jiǎn)單隨機(jī)抽樣的結(jié)果比較,分層抽樣并沒(méi)有明顯優(yōu)于簡(jiǎn)單隨機(jī)抽樣。但相對(duì)而言,分層隨機(jī)抽樣的樣本平均數(shù)波動(dòng)幅度更均勻,簡(jiǎn)單隨機(jī)抽樣中出現(xiàn)了(第2個(gè))偏離總體平均數(shù)的幅度較大的樣本平均數(shù),即出現(xiàn)了比較“極端”的樣本,而分層隨機(jī)抽樣沒(méi)有出現(xiàn)。
實(shí)際上,在個(gè)體之間差異較大的情形下,只要選取的分層變量合適,使得各層間差異明顯、層內(nèi)差異不大,分層隨機(jī)抽樣的效果一般會(huì)好于簡(jiǎn)單隨機(jī)抽樣,也好于很多其他抽樣方法。 分層隨機(jī)抽樣的組織實(shí)施也比簡(jiǎn)單隨機(jī)抽樣方便,而且除了能得到總體的估計(jì)外,還能得到每層的估計(jì)。 在實(shí)際抽樣調(diào)查中,由于實(shí)際問(wèn)題的復(fù)雜性,除了要考慮獲得的樣本的代表性,還要考慮調(diào)查實(shí)施中人力、物力、時(shí)間等因素,因此通常會(huì)把多種抽樣方法組合起來(lái)使用。例如,在分層抽樣中,不同的層內(nèi)除了用簡(jiǎn)單隨機(jī)抽樣外,還可以用其他的抽樣方法,有時(shí)層內(nèi)還需要再進(jìn)行分層,等等。
問(wèn)題四:對(duì)比簡(jiǎn)單隨機(jī)抽樣和分層隨機(jī)抽樣,你能找到什么異同?
例、一個(gè)單位有職工500人,其中不到35歲的有125人,35歲至49歲的有280人,50歲及50歲以上的有95人,為了了解這個(gè)單位職工與身體狀態(tài)有關(guān)的某項(xiàng)指標(biāo),要從中抽取100名職工作為樣本,若職工年齡與這項(xiàng)指標(biāo)有關(guān),應(yīng)該怎樣抽取?
解:用比例分配的分層隨機(jī)抽樣來(lái)抽取樣本,步驟如下:(1)分層.按年齡將500名職工分成三層:不到35歲的職工;35歲至49歲的職工;50歲及50歲以上的職工.(2)確定每層抽取個(gè)體的個(gè)數(shù).抽樣比為100/500=1/5,則在不到35歲的職工中抽取125×(1/5)=25(人);在35歲至49歲的職工中抽取280×(1/5)=56(人);在50歲及50歲以上的職工中抽取95×(1/5)=19(人).(3)在各層分別按隨機(jī)數(shù)法抽取樣本.(4)匯總每層抽樣,組成樣本.
總結(jié): 用比例分配的分層隨機(jī)抽樣抽取樣本的操作步驟
1、某高中共有900人,其中高一年級(jí)300人,高二年級(jí)200人,高三年級(jí)400人,現(xiàn)采用分層抽樣抽取容量為45的樣本,那么高一、高二、高三各年級(jí)抽取的人數(shù)分別為( ) A.15,5,25 B.15,15,15 C.10,5,30 D.15,10,202、某班有男生36人,女生24人,從全班抽取一個(gè)容量為10的樣本,分析某種身體素質(zhì)指標(biāo),已知這種身體素質(zhì)指標(biāo)與性別有關(guān). 問(wèn)應(yīng)采取什么樣抽樣方法?并寫(xiě)出抽樣過(guò)程.
解:因?yàn)檫@種身體素質(zhì)指標(biāo)與性別有關(guān),所以男生,女生身體素質(zhì)指標(biāo)差異明顯,因而采用分層抽樣的方法.具體過(guò)程如下:(1)將60人分為2層,其中男,女生各為一層.(2)按照樣本容量的比例隨機(jī)抽取各層應(yīng)抽取的樣本. 36×1/6=6(人),24×1/6=4(人) 因此男,女生各抽取人數(shù)分別為6人和4人.(3)利用簡(jiǎn)單隨機(jī)抽樣方法分別在36名男生中抽取6人, 24名女生中抽取4人. (4)將這10人組到一起,即得到一個(gè)樣本.
知識(shí)探究(二):獲取數(shù)據(jù)的途徑
問(wèn)題一:如果要了解某電視節(jié)目在你所在地區(qū)(城市、鄉(xiāng)鎮(zhèn)或村莊)的收視率,那么需要獲取相關(guān)的數(shù)據(jù)。你認(rèn)為有哪些途徑可以獲取數(shù)據(jù)?
獲取數(shù)據(jù)的途徑1、通過(guò)調(diào)查獲取數(shù)據(jù);2、通過(guò)試驗(yàn)獲取數(shù)據(jù);3、通過(guò)觀察獲取數(shù)據(jù);4、通過(guò)查詢獲取數(shù)據(jù)。
1、下列問(wèn)題中,采用怎樣的抽樣方法比較合理:①?gòu)?0臺(tái)冰箱中抽取3臺(tái)進(jìn)行質(zhì)量檢查;②某學(xué)校有160名教職工,其中教師120名,行政人員16名,后勤人員24名。為了了解教職工對(duì)學(xué)校在校務(wù)公開(kāi)方面的意見(jiàn),擬抽取一個(gè)容量為20的樣本。2、某工廠生產(chǎn)A、B、C三種不同型號(hào)的產(chǎn)品,產(chǎn)品數(shù)量之比為2:3:5,現(xiàn)用分層抽樣方法抽取一個(gè)容量為n的樣本,樣本中A型產(chǎn)品有16種,那么此樣本容量n=_______.
3、某校有老師200人,男學(xué)生1200人,女學(xué)生1000人,現(xiàn)用分層抽樣的方法從所有師生中抽取一個(gè)容量為n的樣本,已知女學(xué)生中抽取的人數(shù)為80,則n=( ) 4、某大學(xué)數(shù)學(xué)系共有本科生5000人,其中一、二、三、四年級(jí)的學(xué)生比為4:3:2:1,用分層抽樣的方法抽取一個(gè)容量為200人的樣本,則應(yīng)抽取三年級(jí)的學(xué)生為( )人。5、某中學(xué)高一年級(jí)有學(xué)生600人,高二年級(jí)有學(xué)生450人,高三年級(jí)有學(xué)生750人,每個(gè)學(xué)生被抽到的可能性均為0.2,若該校取一個(gè)容量為n的樣本,則n= ( ) 6、常見(jiàn)的獲取數(shù)據(jù)的途徑有( )
調(diào)查、試驗(yàn)、觀察、查詢
7、某公司有1 000名員工,其中:高層管理人員為50名,屬于高收入者;中層管理人員為150名,屬于中等收入者;一般員工為800名,屬于低收入者.要對(duì)這個(gè)公司員工的收入情況進(jìn)行調(diào)查,欲抽取100名員工,應(yīng)當(dāng)怎樣進(jìn)行抽樣?
解:我們可以采用分層抽樣的方法,按照收入水平分成三層:高收入者、中等收入者、低收入者. 從題中數(shù)據(jù)可以看出,高收入者為50名,占所有員工的比例為50/1000=5% .為保證樣本的代表性,在所抽取的100名員工中,高收入者所占的比例也應(yīng)為5%,數(shù)量為100×5%=5,所以應(yīng)抽取5名高層管理人員.同理,抽取15名中層管理人員、80名一般員工,再對(duì)收入狀況分別進(jìn)行調(diào)查.
這是一份數(shù)學(xué)必修 第二冊(cè)9.1 隨機(jī)抽樣多媒體教學(xué)ppt課件,共6頁(yè)。PPT課件主要包含了答案×××,答案A,答案B,答案D等內(nèi)容,歡迎下載使用。
這是一份高中數(shù)學(xué)人教A版 (2019)必修 第二冊(cè)9.1 隨機(jī)抽樣完美版課件ppt,共23頁(yè)。PPT課件主要包含了分層隨機(jī)抽樣,獲得數(shù)據(jù)的途徑,課堂小結(jié)等內(nèi)容,歡迎下載使用。
這是一份數(shù)學(xué)人教A版 (2019)第九章 統(tǒng)計(jì)9.1 隨機(jī)抽樣評(píng)課ppt課件,文件包含912分層隨機(jī)抽樣pptx、912分層演練綜合提升docx等2份課件配套教學(xué)資源,其中PPT共21頁(yè), 歡迎下載使用。
微信掃碼,快速注冊(cè)
注冊(cè)成功