
第十章 統(tǒng)計(jì)、統(tǒng)計(jì)案例
第一講 隨機(jī)抽樣
ZHI SHI SHU LI SHUANG JI ZI CE
知識(shí)梳理·雙基自測(cè)
知識(shí)梳理
知識(shí)點(diǎn)一 總體、個(gè)體、樣本、樣本容量的概念
統(tǒng)計(jì)中所考察對(duì)象的全體構(gòu)成的集合看做總體,構(gòu)成總體的每個(gè)元素作為個(gè)體,從總體中抽取的__一部分個(gè)體__所組成的集合叫做樣本,樣本中個(gè)體的__數(shù)目__叫做樣本容量.
知識(shí)點(diǎn)二 簡(jiǎn)單隨機(jī)抽樣
一般地,設(shè)一個(gè)總體含有N個(gè)個(gè)體,從中逐個(gè)__不放回__地抽取n個(gè)個(gè)體作為樣本(n≤N),如果每次抽取時(shí)總體內(nèi)的各個(gè)個(gè)體被抽到的__機(jī)會(huì)都相等__,就把這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣.
最常用的簡(jiǎn)單隨機(jī)抽樣的方法有兩種:__抽簽法__和__隨機(jī)數(shù)表法__.
知識(shí)點(diǎn)三 系統(tǒng)抽樣
當(dāng)總體中的個(gè)體比較多且均衡時(shí),首先把總體分成均衡的若干部分,然后__按照預(yù)先定出的規(guī)則__,從每一部分中抽取一個(gè)個(gè)體,得到所需要的樣本,這種抽樣方法叫做系統(tǒng)抽樣.
系統(tǒng)抽樣的步驟
一般地,假設(shè)要從容量為N的總體中抽取容量為n的樣本.
(1)先將總體的N個(gè)個(gè)體__編號(hào)__;
(2)確定__分段間隔k__,對(duì)編號(hào)進(jìn)行__分段__.當(dāng)(n是樣本容量)是整數(shù)時(shí),取k=;
(3)在第1段用__簡(jiǎn)單隨機(jī)抽樣__確定第一個(gè)個(gè)體編號(hào)l(k≤k);
(4)按照一定的規(guī)則抽取樣本.通常是將l加上間隔k得到第2個(gè)個(gè)體編號(hào)__(l+k)__,再加k得到第3個(gè)個(gè)體編號(hào)__(l+2k)__,依次進(jìn)行下去,直到獲取整個(gè)樣本.
知識(shí)點(diǎn)四 分層抽樣
一般地,在抽樣時(shí)將總體分成互不交叉的層,然后按照__一定的比例__,從各層獨(dú)立地抽取一定數(shù)量的個(gè)體,將各層取出的個(gè)體合在一起作為樣本,這種抽樣方法叫做分層抽樣.
分層抽樣的應(yīng)用范圍:當(dāng)總體是由__差異明顯的幾個(gè)部分__組成時(shí),往往選用分層抽樣的方法.
重要結(jié)論
1.不論哪種抽樣方法, 總體中的每一個(gè)個(gè)體入樣的概率都是相同的.
2.系統(tǒng)抽樣一般也稱為等距抽樣,入樣個(gè)體的編號(hào)相差分段時(shí)間隔k的整數(shù)倍.
3.分層抽樣是按比例抽樣,每一層入樣的個(gè)體數(shù)為該層的個(gè)體數(shù)乘抽樣比.
雙基自測(cè)
題組一 走出誤區(qū)
1.(多選題)下列結(jié)論中正確的是( AB )
A.簡(jiǎn)單隨機(jī)抽樣是從總體中逐個(gè)不放回的抽取樣本
B.系統(tǒng)抽樣在起始部分抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣
C.要從1 002個(gè)學(xué)生中用系統(tǒng)抽樣的方法選取一個(gè)容量為20的樣本,需要剔除2個(gè)學(xué)生,這樣對(duì)被剔除者不公平
D.抽簽法中,先抽的人抽中的可能性大
題組二 走進(jìn)教材
2.(P100A組T2)某公司有員工500人,其中不到35歲的有125人,35~49歲的有280人,50歲以上的有95人,為了調(diào)查員工的身體健康狀況,從中抽取100名員工,則應(yīng)在這三個(gè)年齡段分別抽取人數(shù)為( B )
A.33,34,33 B.25,56,19
C.30,40,30 D.30,50,20
[解析] 因?yàn)?2528095=255619,所以抽取人數(shù)分別為25,56,19.
3.(P59T2)某班共有52人,現(xiàn)根據(jù)學(xué)生的學(xué)號(hào),用系統(tǒng)抽樣的方法,抽取一個(gè)容量為4的樣本,已知3號(hào),29號(hào),42號(hào)學(xué)生在樣本中,那么樣本中還有一個(gè)學(xué)生的學(xué)號(hào)是( D )
A.10 B.11
C.12 D.16
[解析] 從被抽中的3名學(xué)生的學(xué)號(hào)中可以看出學(xué)號(hào)間距為13,所以樣本中還有一個(gè)學(xué)生的學(xué)號(hào)是16,故選D.
題組三 考題再現(xiàn)
4.(2018·課標(biāo)全國(guó)Ⅲ)某公司有大量客戶,且不同年齡段客戶對(duì)其服務(wù)的評(píng)價(jià)有較大差異.為了解客戶的評(píng)價(jià),該公司準(zhǔn)備進(jìn)行抽樣調(diào)查,可供選擇的抽樣方法有簡(jiǎn)單隨機(jī)抽樣、分層抽樣和系統(tǒng)抽樣,則最合適的抽樣方法是__分層抽樣__.
[解析] 因?yàn)椴煌挲g段客戶對(duì)其服務(wù)的評(píng)價(jià)有較大差異,所以根據(jù)三種抽樣方法的特點(diǎn)可知最合適的抽樣方法是分層抽樣.
5.(2019·課標(biāo)全國(guó)Ⅰ)某學(xué)校為了解1 000名新生的身體素質(zhì),將這些學(xué)生編號(hào)為1,2,…,1 000,從這些新生中用系統(tǒng)抽樣方法等距抽取100名學(xué)生進(jìn)行體質(zhì)測(cè)驗(yàn).若46號(hào)學(xué)生被抽到,則下面4名學(xué)生中被抽到的是( C )
A.8號(hào)學(xué)生 B.200號(hào)學(xué)生
C.616號(hào)學(xué)生 D.815號(hào)學(xué)生
[解析] 將1 000名學(xué)生分成100組,每組10人,則每組抽取的號(hào)碼構(gòu)成公差為10的等差數(shù)列{an},由題意知a5=46,則an=a5+(n-5)×10=10n-4,n∈N*,易知只有C選項(xiàng)滿足題意.故選C.
KAO DIAN TU PO HU DONG TAN JIU
考點(diǎn)突破·互動(dòng)探究
考點(diǎn)一 簡(jiǎn)單隨機(jī)抽樣——自主練透
例1 (1)(2019·陜西模擬)某班級(jí)有男生20人,女生30人,從中抽取10人作為樣本,其中一次抽樣結(jié)果是:抽到了4名男生、6名女生,則下列命題正確的是( A )
A.這次抽樣可能采用的是簡(jiǎn)單隨機(jī)抽樣
B.這次抽樣一定沒有采用系統(tǒng)抽樣
C.這次抽樣中每個(gè)女生被抽到的概率大于每個(gè)男生被抽到的概率
D.這次抽樣中每個(gè)女生被抽到的概率小于每個(gè)男生被抽到的概率
(2)(2019·山西大同)用簡(jiǎn)單隨機(jī)抽樣的方法從含有10個(gè)個(gè)體的總體中,抽取一個(gè)容量為3的樣本,其中某一個(gè)體a“第一次被抽到”的可能性與“第二次被抽到”的可能性分別是( A )
A., B.,
C., D.,
(3)(2020·山西大學(xué)附中診斷)某工廠利用隨機(jī)數(shù)表對(duì)生產(chǎn)的600個(gè)零件進(jìn)行抽樣測(cè)試,先將600個(gè)零件進(jìn)行編號(hào),編號(hào)分別為001,002,…,599,600從中抽取60個(gè)樣本,如下提供隨機(jī)數(shù)表的第4行到第6行:
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42;84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04;32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
若從表中第6行第6列開始向右依次讀取3個(gè)數(shù)據(jù),則得到的第6個(gè)樣本編號(hào)( D )
A.522 B.324
C.535 D.578
[解析] (1)利用排除法求解.這次抽樣可能采用的是簡(jiǎn)單隨機(jī)抽樣,A正確;這次抽樣可能采用系統(tǒng)抽樣,男生編號(hào)為1~20,女生編號(hào)為21~50,間隔為5,依次抽取1號(hào),6號(hào),…,46號(hào)便可,B錯(cuò)誤;這次抽樣中每個(gè)女生被抽到的概率等于每個(gè)男生被抽到的概率,C和D均錯(cuò)誤,故選A.
(2)在抽樣過程中,個(gè)體a每一次被抽中的概率是相等的,因?yàn)榭傮w容量為10,故個(gè)體a“第一次被抽到”的可能性與“第二次被抽到”的可能性均為.故選A.
(3)從第6行第6列開始向右依次讀取3個(gè)數(shù),依次得到的樣本為436,535,577,348,522,578,故選D.
名師點(diǎn)撥 ?
(1)簡(jiǎn)單隨機(jī)抽樣滿足:①抽取的個(gè)體數(shù)有限;②逐個(gè)抽取;③不放回抽取;④等可能抽?。?br />
(2)抽簽法適用于總體中個(gè)體數(shù)較少的情況,隨機(jī)數(shù)表法適用于總體中個(gè)體數(shù)較多的情況.
考點(diǎn)二 系統(tǒng)抽樣——師生共研
例2 (1)(2019·甘肅張掖診斷)某校高三科創(chuàng)班共48人,班主任為了解學(xué)生高考前的心理狀況,將學(xué)生按1至48的學(xué)號(hào)用系統(tǒng)抽樣方法抽取8人進(jìn)行調(diào)查若抽到的最大學(xué)號(hào)為48,則抽到的最小學(xué)號(hào)為__6__.
(2)(2019·湖北模擬)將參加數(shù)學(xué)競(jìng)賽決賽的500名學(xué)生編號(hào)為:001,002,…,500,采用系統(tǒng)抽樣的方法抽取一個(gè)容量為50的樣本,分組后,在第一組采用簡(jiǎn)單隨機(jī)抽樣抽得的號(hào)碼為003.這500名學(xué)生分別在三個(gè)考點(diǎn)考試,從001到200在第一考點(diǎn),從201到355在第二考點(diǎn),從356到500在第三考點(diǎn),則第三考點(diǎn)被抽中的人數(shù)為( A )
A.14 B.15
C.16 D.21
[解析] (1)系統(tǒng)抽樣的抽取間隔為=6,則48-6×7=6,則抽到的最小學(xué)號(hào)為6,故答案為6。
(2)由題意可知,將500名學(xué)生平均分成50組,每組10人,第k(k∈N*)組抽到的號(hào)碼為10(k-1)+3.令356≤10(k-1)+3≤500(k∈N*),解得37≤k≤50,則滿足37≤k≤50的正整數(shù)k有14個(gè),故第三考點(diǎn)被抽中的學(xué)生人數(shù)為14人.故選A.
名師點(diǎn)撥 ?
系統(tǒng)抽樣的特點(diǎn)
(1)適用于元素個(gè)數(shù)很多且均衡的總體.
(2)各個(gè)個(gè)體被抽到的機(jī)會(huì)均等.
(3)總體分組后,在起始部分抽樣時(shí)采用的是簡(jiǎn)單隨機(jī)抽樣.
(4)如果總體容量N能被樣本容量n整除,則抽樣間隔為k=.如果總體容量N不能被樣本容量n整除,可隨機(jī)地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣的方法抽樣.
〔變式訓(xùn)練1〕
(2020·安徽黃山質(zhì)檢)某校高三(1)班共有48人,學(xué)號(hào)依次為1,2,3,…,48,現(xiàn)用系統(tǒng)抽樣的辦法抽取一個(gè)容量為6的樣本.已知學(xué)號(hào)為3,11,19,35,43的同學(xué)在樣本中,那么還有一個(gè)同學(xué)的學(xué)號(hào)應(yīng)為( A )
A.27 B.26
C.25 D.24
[解析] 根據(jù)系統(tǒng)抽樣的規(guī)則——“等距離”時(shí)抽取,也就抽取的號(hào)碼差相等,根據(jù)抽出的序號(hào)可知學(xué)號(hào)之間的差為8,所以在19與35之間還有27,故選A.
考點(diǎn)三 分層抽樣——多維探究
角度1 求某層入樣的個(gè)體數(shù)
例3 (1)(2019·廣西南寧、玉林、貴港等市聯(lián)考)某學(xué)校共有教師300人,其中中級(jí)教師有120人,高級(jí)教師與初級(jí)教師的人數(shù)比為5:4.為了解教師專業(yè)發(fā)展要求,現(xiàn)采用分層抽樣的方法進(jìn)行調(diào)查,在抽取的樣本中有中級(jí)教師72人,則該樣本中的高級(jí)教師人數(shù)為__60__.
(2)(2019·寧波一模)調(diào)查某高中1 000名學(xué)生的身高情況得下表,已知從這批學(xué)生中隨機(jī)抽取1名學(xué)生,抽到偏矮男生的概率為0.12,若用分層抽樣的方法,從這些學(xué)生中隨機(jī)抽取50名,問應(yīng)在偏高學(xué)生中抽取__11__名.
偏矮
正常
偏高
女生/人
100
273
y
男生/人
x
287
z
[解析] (1)學(xué)校共有教師300人,其中中級(jí)教師有120人,
∴高級(jí)教師與初級(jí)教師的人數(shù)為300-120=180人,
∵抽取的樣本中有中級(jí)教師72人,
∴設(shè)樣本人數(shù)為n,則=,解得n=180,
則抽取的高級(jí)教師與初級(jí)教師的人數(shù)為180-72=108,
∵高級(jí)教師與初級(jí)教師的人數(shù)比為54,
∴該樣本中的高級(jí)教師人數(shù)為×108=60.
故答案為60.
(2)由題意可知x=1 000×0.12=120,所以y+z=220.
所以偏高學(xué)生占學(xué)生總數(shù)的比例為=,所以抽50名應(yīng)抽偏高學(xué)生50×=11(人).
角度2 求總體或樣本容量
例4 (1)(2020·湖南模擬)某工廠甲、乙、丙三個(gè)車間生產(chǎn)了同一種產(chǎn)品,數(shù)量分別為120件,80件,60件.為了解它們的產(chǎn)品質(zhì)量是否存在顯著差異,用分層抽樣方法抽取了一個(gè)容量為n的樣本進(jìn)行調(diào)查,其中從丙車間的產(chǎn)品中抽取了3件,則n=( D )
A.9 B.10
C.12 D.13
(2)交通管理部門為了解機(jī)動(dòng)車駕駛員(簡(jiǎn)稱駕駛員)對(duì)某新法規(guī)的知曉情況,對(duì)甲、乙、丙、丁四個(gè)社區(qū)做分層抽樣調(diào)查.假設(shè)四個(gè)社區(qū)駕駛員的總?cè)藬?shù)為N,其中甲社區(qū)有駕駛員96人.若在甲、乙、丙、丁四個(gè)社區(qū)抽取駕駛員的人數(shù)分別為12,21,25,43,則這四個(gè)社區(qū)駕駛員的總?cè)藬?shù)N為__808__.
[解析] (1)由分層抽樣可得,=,解得n=13.故選D.
(2)由題意知抽樣比為,而四個(gè)社區(qū)一共抽取的駕駛員人數(shù)為12+21+25+43=101,故有=,解得N=808.故填808.
名師點(diǎn)撥 ?
進(jìn)行分層抽樣的相關(guān)計(jì)算時(shí),常用到的兩個(gè)關(guān)系:
(1)=;
(2)總體中某兩層的個(gè)體數(shù)之比等于樣本中這兩層所抽取的個(gè)體數(shù)之比__.
〔變式訓(xùn)練2〕
(1)(角度1)(2019·廣東廣州模擬)某公司生產(chǎn)A,B,C三種不同型號(hào)的轎車,產(chǎn)量之比依次為234,為檢驗(yàn)該公司的產(chǎn)品質(zhì)量,用分層抽樣的方法抽取一個(gè)容量為n的樣本,若樣本中A種型號(hào)的轎車比B種型號(hào)的轎車少8輛,則n=( B )
A.96 B.72
C.48 D.36
(2)(角度2)某高中計(jì)劃從全校學(xué)生中按年級(jí)采用分層抽樣方法抽取20名學(xué)生進(jìn)行心理測(cè)試,其中高三有學(xué)生900人,已知高一與高二共抽取了14人,則全校學(xué)生的人數(shù)為( C )
A.2 400 B.2 700
C.3 000 D.3 600
[解析] (1)由題意得n-n=-8,∴n=72,故選B.
(2)設(shè)全校學(xué)生人數(shù)為n,
由題意可知=,
解得n=3 000,故選C.
MING SHI JIANG TAN SU YANG TI SHENG
名師講壇·素養(yǎng)提升
分層抽樣與概率相結(jié)合
例5 (2018·天津高考)已知某校甲、乙、丙三個(gè)年級(jí)的學(xué)生志愿者人數(shù)分別為240,160,160.現(xiàn)采用分層抽樣的方法從中抽取7名同學(xué)去某敬老院參加獻(xiàn)愛心活動(dòng).
(1)應(yīng)從甲、乙、丙三個(gè)年級(jí)的學(xué)生志愿者中分別抽取多少人?
(2)設(shè)抽出的7名同學(xué)分別用A,B,C,D,E,F(xiàn),G表示,現(xiàn)從中隨機(jī)抽取2名同學(xué)承擔(dān)敬老院的衛(wèi)生工作.
①試用所給字母列舉出所有可能的抽取結(jié)果;
②設(shè)M為事件“抽取的2名同學(xué)來自同一年級(jí)”,求事件M發(fā)生的概率.
[解析] (1)由已知,甲、乙、丙三個(gè)年級(jí)的學(xué)生志愿者人數(shù)之比為322,由于采用分層抽樣的方法從中抽取7名同學(xué),因此應(yīng)從甲、乙、丙三個(gè)年級(jí)的學(xué)生志愿者中分別抽取3人,2人,2人.
(2)①從抽出的7名同學(xué)中隨機(jī)抽取2名同學(xué)的所有可能結(jié)果為{A,B},{A,C},{A,D},{A,E},{A,F(xiàn)},{A,G},{B,C},{B,D},{B,E},{B,F(xiàn)},{B,G},{C,D},{C,E},{C,F(xiàn)},{C,G},{D,E},{D,F(xiàn)},{D,G},{E,F(xiàn)},{E,G},{F,G},共21種.
②由(1),不妨設(shè)抽出的7名同學(xué)中,來自甲年級(jí)的是A,B,C,來自乙年級(jí)的是D,E,來自丙年級(jí)的是F,G,則從抽出的7名同學(xué)中隨機(jī)抽取的2名同學(xué)來自同一年級(jí)的所有可能結(jié)果為{A,B},{A,C},{B,C},{D,E},{F,G},共5種,
所以,事件M發(fā)生的概率P(M)=.
名師點(diǎn)撥 ?
分層抽樣與概率相結(jié)合的題目是高考的熱點(diǎn),解題時(shí)先根據(jù)分層抽樣確定人數(shù),再利用古典概型求解相應(yīng)的概率.
〔變式訓(xùn)練3〕
某中學(xué)為了更好地開展社團(tuán)活動(dòng),豐富同學(xué)們的課余生活,現(xiàn)用分層抽樣的方法從“模擬法庭”“街舞”“動(dòng)漫”“話劇”四個(gè)社團(tuán)中抽取若干人組成校社團(tuán)指導(dǎo)小組,有關(guān)數(shù)據(jù)見下表:
社團(tuán)
相關(guān)人數(shù)
抽取人數(shù)
模擬法庭
24
a
街舞
30
5
動(dòng)漫
b
4
話劇
12
c
(1)求a,b,c的值;
(2)若從“動(dòng)漫”與“話劇”社團(tuán)已抽取的人中選2人擔(dān)任指導(dǎo)小組組長(zhǎng),求這2人分別來自這兩個(gè)社團(tuán)的概率.
[解析] (1)由表可知抽取比例為=,故a=4,b=24,c=2.
(2)設(shè)“動(dòng)漫”社團(tuán)的4人分別為:A1,A2,A3,A4;“話劇”社團(tuán)的2人分別為:B1,B2.則從中任選2人的所有基本事件為:(A1,A2),(A1,A3),(A1,A4),(A2,A3),(A2,A4),(A3,A4),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A4,B1),(A4,B2),(B1,B2)共15個(gè).
其中2人分別來自這兩個(gè)社團(tuán)的基本事件為:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A4,B1),(A4,B2),共8個(gè).
所以這2人分別來自這兩個(gè)社團(tuán)的概率P=.
(或這2人分別來自這兩個(gè)社團(tuán)的概率P==)
微信掃碼,快速注冊(cè)
注冊(cè)成功