
一、知識(shí)速覽
二、考點(diǎn)速覽
知識(shí)點(diǎn)1 隨機(jī)抽樣
1、抽樣調(diào)查
(1)總體:統(tǒng)計(jì)中所考察對(duì)象的某一數(shù)值指標(biāo)的全體構(gòu)成的集合稱為總體.
(2)個(gè)體:構(gòu)成總體的每一個(gè)元素叫做個(gè)體.
(3)樣本:從總體中抽取若干個(gè)個(gè)體進(jìn)行考察,這若干個(gè)個(gè)體所構(gòu)成的集合叫做總體的一個(gè)樣本,樣本中個(gè)體的數(shù)目叫做樣本容量.
2、簡單隨機(jī)抽樣
(1)定義:一般地,設(shè)一個(gè)總體含有個(gè)個(gè)體,從中逐個(gè)不放回地抽取個(gè)個(gè)體作為樣本(),如果每次抽取時(shí)總體內(nèi)的各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,就把這種抽樣方法叫做簡單隨機(jī)抽樣.這樣抽取的樣本,叫做簡單隨機(jī)樣本.
(2)兩種常用的簡單隨機(jī)抽樣方法
①抽簽法:一般地,抽簽法就是把總體中的個(gè)個(gè)體編號(hào),把號(hào)碼寫在號(hào)簽上,將號(hào)簽放在一個(gè)容器中,攪拌均勻后,每次從中抽取一個(gè)號(hào)簽,連續(xù)抽取次,就得到一個(gè)容量為的樣本.適用于總體個(gè)數(shù)較少的情況。
②隨機(jī)數(shù)法:即利用隨機(jī)數(shù)表、隨機(jī)數(shù)骰子或計(jì)算機(jī)產(chǎn)生的隨機(jī)數(shù)進(jìn)行抽樣.這里僅介紹隨機(jī)數(shù)表法.隨機(jī)數(shù)表由數(shù)字,,,…,組成,并且每個(gè)數(shù)字在表中各個(gè)位置出現(xiàn)的機(jī)會(huì)都是一樣的.適用于總體個(gè)數(shù)較多的情況,但是當(dāng)總體容量很大時(shí),需要的樣本容量也很大時(shí),利用隨機(jī)數(shù)法抽取樣本仍不方便.
(3)簡單隨機(jī)抽樣的特征(只有四個(gè)特點(diǎn)都滿足的抽樣才是簡單隨機(jī)抽樣)
①有限性:簡單隨機(jī)抽樣要求被抽取的樣本的總體個(gè)數(shù)是有限的,便于通過樣本對(duì)總體進(jìn)行分析.
②逐一性:簡單隨機(jī)抽樣是從總體中逐個(gè)地進(jìn)行抽取,便于實(shí)踐中操作.
③不放回性:簡單隨機(jī)抽樣是一種不放回抽樣,便于進(jìn)行有關(guān)的分析和計(jì)算.
④等可能性:簡單單隨機(jī)抽樣中各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,從而保證了抽樣方法的公平.
3、分層抽樣
(1)定義:一般地,在抽樣時(shí),將總體分成互不交叉的層,然后按照一定的比例,從各層獨(dú)立地抽取一定數(shù)量的個(gè)體,將各層取出的個(gè)體合在一起作為樣本,這種抽樣方法叫做分層抽樣.
分層抽樣適用于已知總體是由差異明顯的幾部分組成的.
(2)分層抽樣問題類型及解題思路
①求某層應(yīng)抽個(gè)體數(shù)量:按該層所占總體的比例計(jì)算.
②已知某層個(gè)體數(shù)量,求總體容量或反之求解:根據(jù)分層抽樣就是按比例抽樣,列比例式進(jìn)行計(jì)算.
③分層抽樣的計(jì)算應(yīng)根據(jù)抽樣比構(gòu)造方程求解,其中“抽樣比=eq \f(樣本容量,總體容量)=eq \f(各層樣本數(shù)量,各層個(gè)體數(shù)量)”
【注意】分層抽樣時(shí),每層抽取的個(gè)體可以不一樣多,但必須滿足抽?。ǎ﹤€(gè)個(gè)體(其中是層數(shù),是抽取的樣本容量,是第層中個(gè)體的個(gè)數(shù),是總體容量).
知識(shí)點(diǎn)2 用樣本估計(jì)總體
1、頻率分布直方圖
(1)頻率、頻數(shù)、樣本容量的計(jì)算方法
①eq \f(頻率,組距)×組距=頻率.
②eq \f(頻數(shù),樣本容量)=頻率,eq \f(頻數(shù),頻率)=樣本容量,樣本容量×頻率=頻數(shù).
③頻率分布直方圖中各個(gè)小方形的面積總和等于.
(2)頻率分布直方圖中數(shù)字特征的計(jì)算
= 1 \* GB3 ①最高的小長方形底邊中點(diǎn)的橫坐標(biāo)即是眾數(shù).
= 2 \* GB3 ②中位數(shù)左邊和右邊的小長方形的面積和是相等的.設(shè)中位數(shù)為,利用左(右)側(cè)矩形面積之和等于,即可求出.
= 3 \* GB3 ③平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個(gè)小長方形的面積乘以小長方形底邊中點(diǎn)的橫坐標(biāo)之和,即有,其中為每個(gè)小長方形底邊的中點(diǎn),為每個(gè)小長方形的面積.
2、百分位數(shù)
(1)定義:一組數(shù)據(jù)的第百分位數(shù)是這樣一個(gè)值,它使得這組數(shù)據(jù)中至少有的數(shù)據(jù)小于或等于這個(gè)值,且至少有的數(shù)據(jù)大于或等于這個(gè)值.
(2)計(jì)算一組個(gè)數(shù)據(jù)的的第百分位數(shù)的步驟
①按從小到大排列原始數(shù)據(jù).
②計(jì)算.
③若不是整數(shù)而大于的比鄰整數(shù),則第百分位數(shù)為第項(xiàng)數(shù)據(jù);若是整數(shù),則第百分位數(shù)為第項(xiàng)與第項(xiàng)數(shù)據(jù)的平均數(shù).
(3)四分位數(shù):我們之前學(xué)過的中位數(shù),相當(dāng)于是第百分位數(shù).在實(shí)際應(yīng)用中,除了中位數(shù)外,常用的分位數(shù)還有第百分位數(shù),第百分位數(shù).這三個(gè)分位數(shù)把一組由小到大排列后的數(shù)據(jù)分成四等份,因此稱為四分位數(shù).
3、樣本的數(shù)字特征
(1)眾數(shù)、中位數(shù)、平均數(shù)
①眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)叫眾數(shù),眾數(shù)反應(yīng)一組數(shù)據(jù)的多數(shù)水平.
②中位數(shù):將一組數(shù)據(jù)按大小順序依次排列,把處在最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù),中位數(shù)反應(yīng)一組數(shù)據(jù)的中間水平.
③平均數(shù):個(gè)樣本數(shù)據(jù)的平均數(shù)為,反應(yīng)一組數(shù)據(jù)的平均水平,公式變形:.
(2)標(biāo)準(zhǔn)差和方差
①標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差是樣本數(shù)據(jù)到平均數(shù)的一種平均距離,一般用表示.假設(shè)樣本數(shù)據(jù)是,表示這組數(shù)據(jù)的平均數(shù),則標(biāo)準(zhǔn)差.
②方差:方差就是標(biāo)準(zhǔn)差的平方,即.顯然,在刻畫樣本數(shù)據(jù)的分散程度上,方差與標(biāo)準(zhǔn)差是一樣的.在解決實(shí)際問題時(shí),多采用標(biāo)準(zhǔn)差.
【注意】標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)程度的大?。畼?biāo)準(zhǔn)差、方差越大,則數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越?。粗嗫捎呻x散程度的大小推算標(biāo)準(zhǔn)差、方差的大?。?br> = 3 \* GB3 ③平均數(shù)、方差的性質(zhì):如果數(shù)據(jù)的平均數(shù)為,方差為,那么
一組新數(shù)據(jù)的平均數(shù)為,方差是.
一新數(shù)據(jù)的平均數(shù)為,方差是.
一組新數(shù)據(jù)的平均數(shù)為,方差是.
知識(shí)點(diǎn)3 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
1、兩個(gè)變量的線性相關(guān)
(1)正相關(guān):在散點(diǎn)圖中,點(diǎn)散布在從左下角到右上角的區(qū)域,對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān).
(2)負(fù)相關(guān):在散點(diǎn)圖中,點(diǎn)散布在從左上角到右下角的區(qū)域,兩個(gè)變量的這種相關(guān)關(guān)系稱為負(fù)相關(guān).
(3)線性相關(guān)關(guān)系、回歸直線:如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.
2、回歸分析與回歸方程
(1)回歸分析的定義:對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.
(2)最小二乘法:使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離的平方和最小的方法叫做最小二乘法.
(3)回歸方程:對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸方程的求法為
其中,,,(,)稱為樣本點(diǎn)的中心.
(3)相關(guān)系數(shù)
若相應(yīng)于變量的取值,變量的觀測(cè)值為,
則變量與的相關(guān)系數(shù),
通常用來衡量與之間的線性關(guān)系的強(qiáng)弱,的范圍為.
= 1 \* GB3 ①當(dāng)時(shí),表示兩個(gè)變量正相關(guān);當(dāng)時(shí),表示兩個(gè)變量負(fù)相關(guān).
= 2 \* GB3 ②越接近,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);越接近,表示兩個(gè)變量間幾乎不存在線性相關(guān)關(guān)系.當(dāng)時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.
= 3 \* GB3 ③通常當(dāng)時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.
3、殘差分析
對(duì)于預(yù)報(bào)變量,通過觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值,通過回歸方程得到的稱為預(yù)測(cè)值,觀測(cè)值減去預(yù)測(cè)值等于殘差,稱為相應(yīng)于點(diǎn)的殘差,即有.
殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對(duì)殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.
(1)殘差圖:通過殘差分析,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.
(2)通過殘差平方和分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;反之,不合適.
(3)相關(guān)指數(shù):用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:.
越接近于,說明殘差的平方和越小,也表示回歸的效果越好.
4、獨(dú)立性檢驗(yàn)
(1)分類變量:變量的不同“值”表示個(gè)體所屬的不同類別,像這類變量稱為分類變量.
(2)列聯(lián)表:
①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.
②2×2列聯(lián)表:假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為2×2列聯(lián)表
(3)獨(dú)立性檢驗(yàn):計(jì)算隨機(jī)變量利用的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn).
一、應(yīng)用隨機(jī)數(shù)法的兩個(gè)關(guān)鍵點(diǎn)
1、確定以表中的哪個(gè)數(shù)(哪行哪列)為起點(diǎn),以哪個(gè)方向?yàn)樽x數(shù)的方向;
2、讀數(shù)時(shí)注意結(jié)合編號(hào)特點(diǎn)進(jìn)行讀取.若編號(hào)為兩位數(shù)字,則兩位兩位地讀取;若編號(hào)為三位數(shù)字,則三位三位地讀取,有超過總體號(hào)碼或出現(xiàn)重復(fù)號(hào)碼的數(shù)字舍去,這樣繼續(xù)下去,直到獲取整個(gè)樣本.
【典例1】(2023·寧夏銀川·銀川一中校考一模)對(duì)件樣品進(jìn)行編號(hào),,,,在如下隨機(jī)數(shù)表中,指定從第行第列開始,從左往右抽取兩個(gè)數(shù)字,抽取個(gè)編號(hào),則抽到的第個(gè)編號(hào)是( )
A. B. C. D.
【答案】D
【解析】自第行第列開始,第一個(gè)編號(hào)為,
去除編號(hào)不在的號(hào)碼和重復(fù)號(hào)碼,依次抽取的個(gè)編號(hào)為:,
則抽到的第個(gè)編號(hào)為.故選:D.
【典例2】(2023上·上海·高三控江中學(xué)??茧A段練習(xí))總體由編號(hào)為、、、、的個(gè)個(gè)體組成,利用隨機(jī)數(shù)表從中抽取個(gè)個(gè)體,下面提供隨機(jī)數(shù)表的第行到第行:
若從表中第行第列開始向右依次讀取,則抽取的第個(gè)個(gè)體的編號(hào)是 .
【答案】
【解析】由題意,結(jié)合隨機(jī)數(shù)表法可知,從中抽取個(gè)個(gè)體的編號(hào)依次為:、、、、,
故答案為:.
二、解決分層抽樣的常用公式
先確定抽樣比,然后把各層個(gè)體數(shù)乘以抽樣比,即得各層要抽取的個(gè)體數(shù).
(1)抽樣比=eq \f(樣本容量,總體容量)=eq \f(各層樣本容量,各層個(gè)體總量);
(2)層1的容量∶層2的容量∶層3的容量=樣本中層1的容量∶樣本中層2的容量∶樣本中層3的容量.
【典例1】(2023上·湖北武漢·高三武鋼三中校考階段練習(xí))某企業(yè)為了解員工身體健康情況,采用分層隨機(jī)抽樣的方法從該企業(yè)的營銷部門和研發(fā)部門抽取部分員工體檢.已知該企業(yè)營銷部門和研發(fā)部門的員工人數(shù)之比是,且被抽到參加體檢的員工中,營銷部門的人數(shù)比研發(fā)部門的人數(shù)多72,則參加體檢的人數(shù)是( )
A.90 B.96 C.108 D.144
【答案】C
【解析】設(shè)參加體檢的人數(shù)有人,
則,解得,即參加體檢的人數(shù)是人.故選:C.
【典例2】(2023·山東濰坊·統(tǒng)考模擬預(yù)測(cè))某高中學(xué)校共有學(xué)生3600人,為了解某次數(shù)學(xué)文化知識(shí)競賽的得分情況,采用分層抽樣的方法從這3600名學(xué)生中抽取一個(gè)容量為48的樣本,若從高一、高二、高三抽取的人數(shù)組成一個(gè)以4為公差的等差數(shù)列,則該學(xué)校高三年級(jí)的學(xué)生人數(shù)為 人.
【答案】1500
【解析】設(shè)從高二抽取的人數(shù)為,則高一抽取的人數(shù)為,高三抽取的人數(shù)為.
所以,解得,所以高三年級(jí)抽取了20人,
由分層抽樣的概念可知高三年級(jí)的學(xué)生人數(shù)為:.
故答案為:1500.
三、頻率分布直方圖的計(jì)算
1、由頻率分布直方圖進(jìn)行相關(guān)計(jì)算需掌握的2個(gè)關(guān)系式
(1)eq \f(頻率,組距)×組距=頻率.
(2)eq \f(頻數(shù),樣本容量)=頻率,此關(guān)系式的變形為eq \f(頻數(shù),頻率)=樣本容量,樣本容量×頻率=頻數(shù).
2、利用頻率分布直方圖估計(jì)樣本的數(shù)字特征的方法
(1)中位數(shù):在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積相等,由此可以估計(jì)中位數(shù)的值.
(2)平均數(shù):平均數(shù)的估計(jì)值等于每個(gè)小矩形的面積乘以矩形底邊中點(diǎn)橫坐標(biāo)之和.
(3)眾數(shù):最高的矩形的中點(diǎn)的橫坐標(biāo).
【典例1】(2023上·貴州黔東南·高三天柱民族中學(xué)校聯(lián)考階段練習(xí))(多選)某工廠為了了解一批產(chǎn)品的質(zhì)量,從中隨機(jī)抽取了100件產(chǎn)品測(cè)量其長度,所得數(shù)據(jù)都在區(qū)間中,其頻率分布直方圖如圖所示,則( )
A.
B.估計(jì)產(chǎn)品長度的樣本數(shù)據(jù)的分位數(shù)是
C.估計(jì)產(chǎn)品長度的樣本數(shù)據(jù)的眾數(shù)是
D.估計(jì)產(chǎn)品長度的樣本數(shù)據(jù)的平均數(shù)是
【答案】ABC
【解析】對(duì)選項(xiàng)A:,解得,正確;
對(duì)選項(xiàng)B:長度在以下的比例為,
長度在以下的比例為,
故分位數(shù)位于內(nèi),設(shè)為,則,解得,正確;
對(duì)選項(xiàng)C:產(chǎn)品長度的樣本數(shù)據(jù)的眾數(shù)是,正確;
對(duì)選項(xiàng)D:平均數(shù)為,錯(cuò)誤.故選:ABC.
【典例2】(2023上·云南昆明·高三??茧A段練習(xí))(多選)在一次考試中,某地抽取一組樣本,將學(xué)生的考分按,,…,分成10組,得到如下頻率分布直方圖:
根據(jù)頻率分布直方圖,則下列結(jié)論正確的是( )
A.規(guī)定分?jǐn)?shù)不低于60分為及格,則及格率為0.6
B.樣本的中位數(shù)為60
C.以頻率作為概率,每組數(shù)據(jù)區(qū)間中點(diǎn)作代表,估計(jì)該地此次考試的平均分為60分
D.規(guī)定此次考試80%的考生定為合格等級(jí),則合格等級(jí)的學(xué)生最低分為40分
【答案】AD
【解析】分?jǐn)?shù)在的頻率為:,A正確;
分?jǐn)?shù)在的頻率為0.4,分?jǐn)?shù)在的頻率為0.56,
由,得樣本的中位數(shù)為66.25,B錯(cuò)誤;
,
,而.
所以估計(jì)該地此次考試的平均分為61.8分,C錯(cuò)誤;
分?jǐn)?shù)在的頻率為0.2,所以合格等級(jí)的學(xué)生最低為40分,D正確.故選:AD.
四、百分位數(shù)的計(jì)算
計(jì)算一組個(gè)數(shù)據(jù)的的第百分位數(shù)的步驟
①按從小到大排列原始數(shù)據(jù).
②計(jì)算.
③若不是整數(shù)而大于的比鄰整數(shù),則第百分位數(shù)為第項(xiàng)數(shù)據(jù);若是整數(shù),則第百分位數(shù)為第項(xiàng)與第項(xiàng)數(shù)據(jù)的平均數(shù).
【典例1】(2023上·陜西榆林·高三子洲中學(xué)??计谥校┠承8咭荒昙?jí)18個(gè)班參加藝術(shù)節(jié)合唱比賽,通過簡單隨機(jī)抽樣,獲得了10個(gè)班的比賽得分如下:91,89,90,92,94,87,93,96,91,85,則這組數(shù)據(jù)的80%分位數(shù)為( )
A.92 B.93 C.92.5 D.93.5
【答案】D
【解析】比賽得分按從小到大排列為85,87,89,90,91,91,92,93,94,96,,
所以這組數(shù)據(jù)的分位數(shù)為.故選:D.
【典例2】(2023上·廣東惠州·高三統(tǒng)考階段練習(xí))在一次籃球比賽中,某支球隊(duì)共進(jìn)行了8場(chǎng)比賽,得分分別為:29,30,38,25,37,40,42,32,那么這組數(shù)據(jù)的第75百分位數(shù)為( )
A.37.5 B.38 C.39 D.40
【答案】C
【解析】數(shù)據(jù)按從小到大排序?yàn)椋?br>而,故第75百分位數(shù)為,故選:C
五、用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征
利用樣本的數(shù)字特征解決優(yōu)化決策問題的依據(jù)
(1)平均數(shù)反映了數(shù)據(jù)取值的平均水平;標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大?。畼?biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定.
(2)用樣本估計(jì)總體就是利用樣本的數(shù)字特征來描述總體的數(shù)字特征.
【典例1】(2023上·云南楚雄·高三統(tǒng)考期中)現(xiàn)有一組數(shù)據(jù),,,,的平均數(shù)為8,若隨機(jī)去掉一個(gè)數(shù)(,2,3,4,5)后,余下的四個(gè)數(shù)的平均數(shù)為9,則下列說法正確的是( )
A.余下四個(gè)數(shù)的極差比原來五個(gè)數(shù)的極差更小 B.余下四個(gè)數(shù)的中位數(shù)比原來五個(gè)數(shù)的中位數(shù)更大
C.余下四個(gè)數(shù)的最小值比原來五個(gè)數(shù)的最小值更大 D.去掉的數(shù)一定是4
【答案】D
【解析】因?yàn)?,,,,的平均?shù)為8,設(shè)去掉后余下的四個(gè)數(shù)的平均數(shù)為9,
則,D正確.
例如這5個(gè)數(shù)分別為3,4,4,4,25,則去掉4之后,極差依然不變?yōu)?2,
中位數(shù)不變依然為4不變,,最小值不變依然為3,則C錯(cuò)誤則可得A,B,C錯(cuò)誤.故選:D.
【典例2】(2023·浙江金華·校聯(lián)考模擬預(yù)測(cè))有一組樣本數(shù)據(jù),則( )
A.這組樣本數(shù)據(jù)的極差不小于4 B.這組樣本數(shù)據(jù)的平均數(shù)不小于4
C.這組樣本數(shù)據(jù)的中位數(shù)不小于3 D.這組樣本數(shù)據(jù)的眾數(shù)等于3
【答案】A
【解析】樣本數(shù)據(jù)中,
對(duì)于A,顯然這組樣本數(shù)據(jù)的極差大于等于,故A正確;
對(duì)于B,若,則平均數(shù)為,故B錯(cuò)誤;
對(duì)于C,若,則中位數(shù)為,故C錯(cuò)誤;
對(duì)于D,若,則眾數(shù)為,故D錯(cuò)誤.故選:A
【典例3】(2023·全國·校聯(lián)考模擬預(yù)測(cè))已知樣本數(shù)據(jù)都為正數(shù),其方差,則樣本數(shù)據(jù)、、、、的平均數(shù)為 .
【答案】11
【解析】根據(jù)題意,設(shè)樣本數(shù)據(jù)、、、、的平均數(shù)為,
其方差
,
又,
則有,解得,
則樣本數(shù)據(jù)、、、、的平均數(shù)為;
故答案為:11.
六、判斷相關(guān)關(guān)系的2種方法
1、散點(diǎn)圖法:如果所有的樣本點(diǎn)都落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系.如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系;
2、相關(guān)系數(shù)法:利用相關(guān)系數(shù)判定,當(dāng)|r|越趨近于1時(shí),相關(guān)性越強(qiáng)
【典例1】(2023·浙江杭州·統(tǒng)考二模)某興趣小組研究光照時(shí)長x(h)和向日葵種子發(fā)芽數(shù)量y(顆)之間的關(guān)系,采集5組數(shù)據(jù),作如圖所示的散點(diǎn)圖.若去掉后,下列說法正確的是( )
A.相關(guān)系數(shù)r變小 B.決定系數(shù)變小
C.殘差平方和變大 D.解釋變量x與預(yù)報(bào)變量y的相關(guān)性變強(qiáng)
【答案】D
【解析】從圖中可以看出較其他點(diǎn),偏離直線遠(yuǎn),故去掉后,回歸效果更好,
對(duì)于A,相關(guān)系數(shù)越接近于1,模型的擬合效果越好,
若去掉后,相關(guān)系數(shù)r變大,故A錯(cuò)誤;
對(duì)于B,決定系數(shù)越接近于1,模型的擬合效果越好,
若去掉后,決定系數(shù)變大,故B錯(cuò)誤;
對(duì)于C,殘差平方和越小,模型的擬合效果越好,若去掉后,殘差平方和變小,故C錯(cuò)誤;
對(duì)于D,若去掉后,解釋變量x與預(yù)報(bào)變量y的相關(guān)性變強(qiáng),且是正相關(guān),故D正確.
故選:D.
【典例2】(2023上·天津薊州·高三??奸_學(xué)考試)對(duì)兩個(gè)變量,進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù),對(duì)兩個(gè)變量,進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù),則下列判斷正確的是( )
A.變量與正相關(guān),變量與負(fù)相關(guān),變量與的線性相關(guān)性較強(qiáng)
B.變量與負(fù)相關(guān),變量與正相關(guān),變量與的線性相關(guān)性較強(qiáng)
C.變量與正相關(guān),變量與負(fù)相關(guān),變量與的線性相關(guān)性較強(qiáng)
D.變量與負(fù)相關(guān),變量與正相關(guān),變量與的線性相關(guān)性較強(qiáng)
【答案】C
【解析】因?yàn)榫€性相關(guān)系數(shù),所以,正相關(guān),
因?yàn)榫€性相關(guān)系數(shù),所以,負(fù)相關(guān),
又因?yàn)?,所以變量,的線性相關(guān)性比,的線性相關(guān)性強(qiáng),
故A、B、D錯(cuò)誤,C正確.故選:C.
七、線性回歸分析問題的類型及解題方法
1、求回歸直線方程
①計(jì)算出eq \x\t(x),eq \x\t(y),eq \i\su(i=1,n,x)eq \\al(2,i),eq \i\su(i=1,n,x)iyi或eq \i\su(i=1,n, )(xi-eq \x\t(x))(yi-eq \x\t(y)),eq \i\su(i=1,n, )(xi-eq \x\t(x))2的值;
②利用公式計(jì)算回歸系數(shù)eq \(a,\s\up6(^)),eq \(b,\s\up6(^));
③寫出回歸直線方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)).
2、回歸模型的擬合效果:利用相關(guān)系數(shù)r判斷,當(dāng)|r|越趨近于1時(shí),兩變量的線性相關(guān)性越強(qiáng).
【典例1】(2023·江西景德鎮(zhèn)·統(tǒng)考一模)對(duì)某位運(yùn)動(dòng)員近5次比賽成績統(tǒng)計(jì)如下表:
根據(jù)表可得y關(guān)于x的線性回歸方程為:,則下列說法不正確的是( )
A. B.y與x的相關(guān)系數(shù)
C.得分y的方差為22.8 D.預(yù)測(cè)第6次比賽成績約為54
【答案】C
【解析】由表格數(shù)據(jù),,,
所以,故,當(dāng),則,A、D對(duì);
,C錯(cuò);
,B對(duì).故選:C
【典例2】(2023上·廣東廣州·高三廣東廣雅中學(xué)??茧A段練習(xí))新冠肺炎疫情發(fā)生以來,中醫(yī)藥全面參與疫情防控救治,做出了重要貢獻(xiàn).某中醫(yī)藥企業(yè)根據(jù)市場(chǎng)調(diào)研與模擬,得到研發(fā)投入(億元)與產(chǎn)品收益(億元)的數(shù)據(jù)統(tǒng)計(jì)如下:
(1)計(jì)算,的相關(guān)系數(shù),并判斷是否可以認(rèn)為研發(fā)投入與產(chǎn)品收益具有較高的線性相關(guān)程度?(若,則線性相關(guān)程度一般,若,則線性相關(guān)程度較高)
(2)求出關(guān)于的線性回歸方程,并預(yù)測(cè)若想收益超過50(億元)則需研發(fā)投入至少多少億元?(結(jié)果保留一位小數(shù))參考數(shù)據(jù):,.
附:相關(guān)系數(shù)公式:,
回歸直線方程的斜率,截距.
【答案】(1),線性相關(guān)程度較高;(2)回歸直線方程為;至少投資億元
【解析】(1),
,
,,
所以,所以線性相關(guān)程度較高.
(2)由(1)得,,
所以,,
所以,由,得,
所以至少投資億元.
八、非線性回歸分析的求法
(1)根據(jù)原始數(shù)據(jù)作出散點(diǎn)圖;
(2)根據(jù)散點(diǎn)圖選擇恰當(dāng)?shù)臄M合函數(shù);
(3)作恰當(dāng)變換,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方程;
(4)在(3)的基礎(chǔ)上通過相應(yīng)變換,即可得非線性回歸方程.
【典例1】(2023上·重慶渝中·高三統(tǒng)考期中)當(dāng)前,新一輪科技革命和產(chǎn)業(yè)變革蓬勃興起,以區(qū)塊鏈為代表的新一代信息技術(shù)迅猛發(fā)展,現(xiàn)收集某地近6年區(qū)塊鏈企業(yè)總數(shù)量相關(guān)數(shù)據(jù),如下表:
(1)若用模型擬合與的關(guān)系,根據(jù)提供的數(shù)據(jù),求出與的經(jīng)驗(yàn)回歸方程;
(2)為了促進(jìn)公司間的合作與發(fā)展,區(qū)塊鏈聯(lián)合總部決定進(jìn)行一次信息化技術(shù)比賽,邀請(qǐng)甲、乙、丙三家區(qū)塊鏈公司參賽.比賽規(guī)則如下:①每場(chǎng)比賽有兩個(gè)公司參加,并決出勝負(fù);②每場(chǎng)比賽獲勝的公司與未參加此場(chǎng)比賽的公司進(jìn)行下一場(chǎng)的比賽;③在比賽中,若有一個(gè)公司首先獲勝兩場(chǎng),則本次比賽結(jié)束,該公司獲得此次信息化比賽的“優(yōu)勝公司”.已知在每場(chǎng)比賽中,甲勝乙的概率為,甲勝丙的概率為,乙勝丙的概率為,若首場(chǎng)由甲乙比賽,求甲公司獲得“優(yōu)勝公司”的概率.
參考數(shù)據(jù):,其中,
參考公式:對(duì)于一組數(shù)據(jù),其經(jīng)驗(yàn)回歸直線的斜率和截距的最小二乘估計(jì)分別為
【答案】(1);(2)
【解析】(1)令,
,
則,
,所以,
所以;
(2)設(shè)甲公司獲得“優(yōu)勝公司”為事件,
則,
所以甲公司獲得“優(yōu)勝公司”的概率為.
【典例2】(2023·廣西南寧·南寧三中校考一模)數(shù)據(jù)顯示中國車載音樂已步入快速發(fā)展期,隨著車載音樂的商業(yè)化模式進(jìn)一步完善,市場(chǎng)將持續(xù)擴(kuò)大,下表為2018-2022年中國車載音樂市場(chǎng)規(guī)模(單位:十億元),其中年份2018—2022對(duì)應(yīng)的代碼分別為1-5.
(1)由上表數(shù)據(jù)知,可用指數(shù)函數(shù)模型擬合與的關(guān)系,請(qǐng)建立關(guān)于的回歸方程;
(2)根據(jù)上述數(shù)據(jù)求得關(guān)于的回歸方程后,預(yù)測(cè)2024年的中國車載音樂市場(chǎng)規(guī)模.
參考數(shù)據(jù):
其中,.
參考公式:對(duì)于一組數(shù)據(jù),,,其回歸直線的斜率和截距的最小二乘法估計(jì)公式分別為,.
【答案】(1);(2)45.628(十億元).
【解析】(1)因?yàn)椋詢蛇呁瑫r(shí)取自然對(duì)數(shù),得,
設(shè),所以,
設(shè),,則,
因?yàn)?,?br>所以,
,所以,,
所以,,所以
(2)把2024年代碼代入方程,
得(十億元)
故預(yù)測(cè)2024年的中國車載音樂市場(chǎng)規(guī)模45.628(十億元)
九、獨(dú)立性檢驗(yàn)的一般步驟
(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表.
(2)根據(jù)公式計(jì)算.
(3)比較與臨界值的大小關(guān)系,作統(tǒng)計(jì)推斷.
【典例1】(2023上·江西撫州·高三校考期中)“一帶一路”是促進(jìn)各國共同發(fā)展,實(shí)現(xiàn)共同繁榮的合作共贏之路.為了了解我國與某國在“一帶一路”合作中兩國的貿(mào)易量情況,隨機(jī)抽查了100天進(jìn)口貿(mào)易量與出口貿(mào)易量(單位:億人民幣/天)得下表:
附:.
(1)估計(jì)事件“我國與該國貿(mào)易中,一天的進(jìn)口貿(mào)易量與出口貿(mào)易量均不超過100億人民幣”的概率;
(2)根據(jù)所給數(shù)據(jù),完成下面的列聯(lián)表:
(3)根據(jù)(2)中的列聯(lián)表,判斷是否有99%的把握認(rèn)為“我國與該國貿(mào)易中一天的進(jìn)口貿(mào)易量與出口貿(mào)易量”有關(guān)?
【答案】(1);(2)列聯(lián)表見解析;
(3)有99%的把握認(rèn)為我國與該國貿(mào)易中一天的進(jìn)口貿(mào)易量與出口貿(mào)易量有關(guān).
【解析】(1)由表中,在100天中,進(jìn)口貿(mào)易與出口貿(mào)易均不超過100的天數(shù)為,
用頻率估計(jì)概率,可得所求概率為.
(2)列出列聯(lián)表如下:
(3)由(2)得 ,
所以有99%的把握認(rèn)為我國與該國貿(mào)易中一天的進(jìn)口貿(mào)易量與出口貿(mào)易量有關(guān).
【典例2】(2023上·四川成都·高三四川省成都列五中學(xué)??茧A段練習(xí))最近,紀(jì)錄片《美國工廠》引起中美觀眾熱議,大家都認(rèn)識(shí)到,大力發(fā)展制造業(yè),是國家強(qiáng)盛的基礎(chǔ),而產(chǎn)業(yè)工人的年齡老化成為阻礙美國制造業(yè)發(fā)展的障礙,中國應(yīng)未雨綢繆.某工廠有35周歲以上(含35周歲)工人300名,35周歲以下工人200名,為研究工人的日平均生產(chǎn)量是否與年齡有關(guān).現(xiàn)采用分層抽樣的方法,從中抽取了100名工人,先統(tǒng)計(jì)了他們某月的日平均生產(chǎn)件數(shù),然后按工人年齡在“35周歲以上(含35周歲)”和“35周歲以下”分為兩組,在將兩組工人的日平均生產(chǎn)件數(shù)分成5組:分別加以統(tǒng)計(jì),得到如圖所示的頻率分布直方圖.
,附表:
(1)從樣本中日平均生產(chǎn)件數(shù)不足60件的工人中隨機(jī)抽取2人,求至少抽到一名“35周歲以下組”工人的概率.
(2)規(guī)定日平均生產(chǎn)件數(shù)不少于80件者為“生產(chǎn)能手”,請(qǐng)你根據(jù)已知條件完成的列聯(lián)表,并判斷是否有95%的把握認(rèn)為“生產(chǎn)能手與工人所在的年齡組有關(guān)”?
【答案】(1);(2)列聯(lián)表見解析,有把握.
【解析】(1)由已知得,樣本中有35周歲以上組工人60名,35周歲以下組工人40名,
所以,樣本中日平均生產(chǎn)件數(shù)不足60件的工人中,
35周歲以上組工人有(人),記為;
35周歲以下組工人有(人),記為,
從中隨機(jī)抽取2名工人,所有可能的結(jié)果共有10種:
,,,,
至少有一名“35周歲以下組”工人的可能結(jié)果共有7種:
,,,,,,,
故所求的概率:.
(2)由頻率分布直方圖可知,在抽取的100名工人中,
“35周歲以上組”中的生產(chǎn)能手(人),
“35周歲以下組”中的生產(chǎn)能手(人),
據(jù)此可得列聯(lián)表如下:
所以得:,
所以有95%的把握認(rèn)為“生產(chǎn)能手與工人所在的年齡組有關(guān)”.
易錯(cuò)點(diǎn)1 對(duì)統(tǒng)計(jì)圖表中的概念理解不清,識(shí)圖不準(zhǔn)確
點(diǎn)撥:求解統(tǒng)計(jì)圖表問題,重要的是認(rèn)真觀察圖表,發(fā)現(xiàn)有用信息和數(shù)據(jù)。對(duì)于頻率分布直方圖,應(yīng)注意圖中的每一個(gè)小矩形的面積是落在該區(qū)間上的頻率,所有小矩形的面積和為1,當(dāng)小矩形等高時(shí),說明頻率相等,計(jì)算時(shí)不要漏掉其中一個(gè).
【典例1】(2023下·河北秦皇島·高三校聯(lián)考開學(xué)考試)(多選)下圖反映2017年到2022年6月我國國有企業(yè)營業(yè)總收入及增速統(tǒng)計(jì)情況:
2017年到2022年6月國有企業(yè)營業(yè)總收入及增速統(tǒng)計(jì)圖
根據(jù)圖中的信息,下列說法錯(cuò)誤的是( )
A.2017-2022年我國國有企業(yè)營業(yè)總收入逐年增加
B.2017-2022年我國國有企業(yè)營業(yè)總收入逐年下降
C.2017-2021年中,我國國有企業(yè)營業(yè)總收入增速最快的是2021年
D.2017-2021年我國國有企業(yè)營業(yè)總收入的平均數(shù)大于630000億元
【答案】ABD
【解析】由圖知.2022年下半年我國國有企業(yè)營業(yè)總收入及增速未知,故A、B錯(cuò)誤;
2017-2021年中,我國國有企業(yè)營業(yè)總收入增速最快的是2021年,為,C正確;
2017-2021年我國國有企業(yè)營業(yè)總收入的平均數(shù)小于630000億元.D錯(cuò)誤.故選:ABD.
【典例2】(2023上·云南曲靖·高三??茧A段練習(xí))(多選)在某市高二年級(jí)舉行的一次體育統(tǒng)考中,共有10000名考生參加考試.為了解考生的成績情況,隨機(jī)抽取了名考生的成績,其成績均在區(qū)間,按照分組作出如圖所示的頻率分布直方圖.若在樣本中,成績落在區(qū)間的人數(shù)為32,則( )
A.
B.考生成績的中位數(shù)為71
C.考生成績的第70百分位數(shù)為75
D.估計(jì)該市考生成績的平均分為70.6(每組數(shù)據(jù)以區(qū)間的中點(diǎn)值為代表)
【答案】BD
【解析】對(duì)于A,由頻率分布直方圖可得,
則,故A錯(cuò)誤;
對(duì)于B,考生成績的中位數(shù)為,故B正確;
對(duì)于C,設(shè)考生成績的第70百分位數(shù)為,由于數(shù)據(jù)在的頻率為,
故,則,故C錯(cuò)誤;
對(duì)于D,該市考生成績的平均分為,故D正確.
故選:BD.
【典例3】(2023·河南·校聯(lián)考二模)某銀行為客戶定制了A,B,C,D,E共5個(gè)理財(cái)產(chǎn)品,并對(duì)5個(gè)理財(cái)產(chǎn)品的持有客戶進(jìn)行抽樣調(diào)查,得出如下的統(tǒng)計(jì)圖:
用該樣本估計(jì)總體,以下四個(gè)說法錯(cuò)誤的是( )
A.44~56周歲人群理財(cái)人數(shù)最多
B.18~30周歲人群理財(cái)總費(fèi)用最少
C.B理財(cái)產(chǎn)品更受理財(cái)人青睞
D.年齡越大的年齡段的人均理財(cái)費(fèi)用越高
【答案】B
【解析】A.44~56周歲人群理財(cái)人數(shù)所占比例是37%,是最多的,故正確;
B.設(shè)總?cè)藬?shù)為a,則18~30周歲人群的人均理財(cái)費(fèi)用約為,
31~43周歲人群的人均理財(cái)費(fèi)用約為,
44~56周歲人群的人均理財(cái)費(fèi)用約為,
57周歲人群的人均理財(cái)費(fèi)用約為,
所以57周歲及以上人群的人均理財(cái)費(fèi)用最少,故錯(cuò)誤;
C.由條形圖可知:B理財(cái)產(chǎn)品更受理財(cái)人青睞,故正確;
D.由折線圖知:年齡越大的年齡段的人均理財(cái)費(fèi)用越高,故正確,故選:B
易錯(cuò)點(diǎn)2 對(duì)樣本數(shù)字特征認(rèn)識(shí)不到位
點(diǎn)撥:統(tǒng)計(jì)學(xué)的另一基本思想是通過科學(xué)合理地獲取樣本,再通過對(duì)樣本數(shù)據(jù)的處理,用樣本數(shù)字特征去估計(jì)總體的相應(yīng)數(shù)字特征。對(duì)此我們要有一個(gè)辯證的理解,即有時(shí)會(huì)出現(xiàn)偏差,而解決這一問題的方法是適度增加樣本容量,當(dāng)樣本容量越大,它對(duì)總體接近程度越大,可信度越高。
【典例1】(2023上·山東濟(jì)南·高三統(tǒng)考期末)(多選)有一組樣本數(shù)據(jù),其樣本平均數(shù)為.現(xiàn)加入一個(gè)新數(shù)據(jù),且,組成新的樣本數(shù)據(jù),與原樣本數(shù)據(jù)相比,新的樣本數(shù)據(jù)可能( )
A.平均數(shù)不變 B.眾數(shù)不變 C.極差變小 D.第20百分位數(shù)變大
【答案】BD
【解析】因?yàn)?,所以新的樣本?shù)據(jù)平均數(shù)減小,A錯(cuò)誤;
加入一個(gè)新數(shù)據(jù),則眾數(shù)仍有可能為原數(shù)據(jù)的眾數(shù),B正確;
若加入一個(gè)新數(shù)據(jù)不是最大值也不是最小值,則新數(shù)據(jù)極差等于原數(shù)據(jù)極差,C錯(cuò)誤;
若為原數(shù)據(jù)從小到大排列的第20為后的數(shù),因?yàn)闃颖緮?shù)增加,所以第20百分位數(shù)可能后移,
則新數(shù)據(jù)第20百分位數(shù)可能變大.D正確,故選:BD.
【典例2】(2023上·湖南·高三校聯(lián)考階段練習(xí))(多選)已知數(shù)據(jù)成公差大于0的等差數(shù)列,若去掉數(shù)據(jù),則( )
A.極差不變 B.第25百分位數(shù)變大 C.平均數(shù)不變 D.方差變小
【答案】AC
【解析】選項(xiàng)A,根據(jù)極差的定義,原數(shù)據(jù)的極差為,去掉后的極差為,
即極差不變,故A正確;
選項(xiàng)B,原數(shù)據(jù)的第25百分位數(shù)為,去掉后的第25百分位數(shù)為,
即第25百分位數(shù)變小,故B錯(cuò)誤;
選項(xiàng)C,原數(shù)據(jù)的平均數(shù)為,去掉后的平均數(shù)為
,即平均數(shù)不變,故C正確;
選項(xiàng)D,則原數(shù)據(jù)的方差為,去掉后的方差為
,
故,即方差變大,故D錯(cuò)誤.故選:AC.
【典例3】(2023上·廣西玉林·高三校聯(lián)考開學(xué)考試)(多選)已知一組樣本數(shù)據(jù),現(xiàn)有兩組新數(shù)據(jù):第①組數(shù)據(jù)和第②組數(shù)據(jù),則與原數(shù)據(jù)相比,下列說法正確的是( )
A.第①組數(shù)據(jù)中位數(shù)不變 B.第①組數(shù)據(jù)平均數(shù)不變或變大
C.第②組數(shù)據(jù)極差變小 D.第②組數(shù)據(jù)方差變小
【答案】BCD
【解析】對(duì)于A,當(dāng)原數(shù)據(jù)全是負(fù)數(shù)時(shí),原數(shù)據(jù)中位數(shù)是負(fù)數(shù),
而第①組樣本數(shù)據(jù)全是正數(shù),中位數(shù)為正數(shù),A錯(cuò)誤;
對(duì)于B,當(dāng)原數(shù)據(jù)全是非負(fù)數(shù)時(shí),第①組樣本數(shù)據(jù)平均數(shù)不變,否則平均數(shù)變大,B正確;
對(duì)于C,第②組數(shù)據(jù)極差為,作差比較得:
,極差變小,C正確;
對(duì)于D,第②組數(shù)據(jù)與原數(shù)據(jù)平均數(shù)相等,而極差變小,
說明第②組數(shù)據(jù)相對(duì)于原數(shù)據(jù)更集中于平均數(shù),因此方差變小,D正確.故選:BCD
易錯(cuò)點(diǎn)3 求解獨(dú)立性檢驗(yàn)問題對(duì)的值理解不準(zhǔn)確
點(diǎn)撥: 構(gòu)造一個(gè)隨機(jī)變量,其中為樣本容量.如果的觀測(cè)值,就認(rèn)為“兩個(gè)分類變量之間有關(guān)系”;否則就認(rèn)為“兩個(gè)分類變量之間沒有關(guān)系”.我們稱這樣的為一個(gè)判斷規(guī)則的臨界值.
【典例1】(2023·陜西榆林·統(tǒng)考三模)若由一個(gè)列聯(lián)表中的數(shù)據(jù)計(jì)算得,則( )
A.能有的把握認(rèn)為這兩個(gè)變量有關(guān)系
B.能有的把握認(rèn)為這兩個(gè)變量沒有關(guān)系
C.能有的把握認(rèn)為這兩個(gè)變量有關(guān)系
D.能有的把握認(rèn)為這兩個(gè)變量沒有關(guān)系
【答案】A
【解析】因?yàn)椋阅苡械陌盐照J(rèn)為這兩個(gè)變量有關(guān)系.故選:A
【典例2】(2022·河南·校聯(lián)考模擬預(yù)測(cè))為考察一種新藥預(yù)防疾病的效果,某科研小組進(jìn)行動(dòng)物實(shí)驗(yàn),收集整理數(shù)據(jù)后將所得結(jié)果填入相應(yīng)的列聯(lián)表中,由列聯(lián)表中的數(shù)據(jù)計(jì)算得.參照附表,下列結(jié)論正確的是( )
附表:
A.在犯錯(cuò)誤的概率不超過0.1%的前提下,認(rèn)為“藥物有效”
B.在犯錯(cuò)誤的概率不超過0.1%的前提下,認(rèn)為“藥物無效”
C.有99%以上的把握認(rèn)為“藥物有效”
D.有99%以上的把握認(rèn)為“藥物無效”
【答案】C
【解析】因?yàn)?,即,所以有以上的把握認(rèn)為“藥物有效”.故選:C.
【典例3】(2023·廣東深圳·深圳中學(xué)統(tǒng)考模擬預(yù)測(cè))(多選)某研究機(jī)構(gòu)為了探究吸煙與肺氣腫是否有關(guān),調(diào)查了200人.統(tǒng)計(jì)過程中發(fā)現(xiàn)隨機(jī)從這200人中抽取一人,此人為肺氣腫患者的概率為0.1.在制定列聯(lián)表時(shí),由于某些因素缺失了部分?jǐn)?shù)據(jù),而獲得如圖所示的列聯(lián)表,下列結(jié)論正確的是( )
參考公式與臨界值表:
A.不吸煙患肺氣腫的人數(shù)為5人 B.200人中患肺氣腫的人數(shù)為10人
C.的觀測(cè)值 D.按99.9%的可靠性要求,可以認(rèn)為“吸煙與肺氣腫有關(guān)系”
【答案】AD
【解析】A選項(xiàng),200人中抽取一人,此人為肺氣腫患者的概率為0.1,故肺氣腫患者共有人,
由于吸煙患肺氣腫的人數(shù)為15人,故不吸煙患肺氣腫的人數(shù)為5人,A正確,B錯(cuò)誤;
C選項(xiàng),列聯(lián)表如下:
則的觀測(cè)值,C錯(cuò)誤;
D選項(xiàng),由于,故按99.9%的可靠性要求,可以認(rèn)為“吸煙與肺氣腫有關(guān)系”,D正確.
故選:AD總計(jì)
總計(jì)
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
比賽次數(shù)x
1
2
3
4
5
得分y
39
40
48
48
50
研發(fā)投入(億元)
1
2
3
4
5
產(chǎn)品收益(億元)
3
7
9
10
11
年份
2017
2018
2019
2020
2021
2022
編號(hào)
1
2
3
4
5
6
企業(yè)總數(shù)量(單位:百個(gè))
50
78
124
121
137
352
年份代碼
1
2
3
4
5
車載音樂市場(chǎng)規(guī)模
2.8
3.9
7.3
12.0
17.0
1.94
33.82
1.7
1.6
26.84
進(jìn)口
出口
32
18
4
6
8
12
3
7
10
0.050
0.010
0.001
3.841
6.635
10.828
進(jìn)口
出口
進(jìn)口
出口
64
16
10
10
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
生產(chǎn)能手
非生產(chǎn)能手
合計(jì)
35歲以下
35歲以上
合計(jì)
生產(chǎn)能手
非生產(chǎn)能手
合計(jì)
35歲以下
10
30
40
35歲以上
30
30
60
合計(jì)
40
60
100
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
0.050
0.025
0.010
0.005
0.001
3.841
5.02
6.635
7.879
10.828
患肺氣腫
不患肺氣腫
合計(jì)
吸煙
15
不吸煙
120
合計(jì)
200
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
患肺氣腫
不患肺氣腫
合計(jì)
吸煙
15
60
75
不吸煙
5
120
125
合計(jì)
20
180
200
這是一份高考數(shù)學(xué)專題練 專題五概率與統(tǒng)計(jì) 微專題33 統(tǒng)計(jì)與成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(含答案),共28頁。
這是一份高考數(shù)學(xué)專題五概率與統(tǒng)計(jì) 微專題33 統(tǒng)計(jì)與成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析課件PPT,共60頁。PPT課件主要包含了考點(diǎn)二回歸分析,所以可得如下數(shù)據(jù),考點(diǎn)三獨(dú)立性檢驗(yàn),由頻數(shù)分布表知μ=,∴列聯(lián)表為,臨界值表,方法二調(diào)整后的等內(nèi)容,歡迎下載使用。
這是一份微專題18 統(tǒng)計(jì)與成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析,共12頁。
微專題18 統(tǒng)計(jì)與成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
專題18 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(公式、定理、結(jié)論圖表)-備戰(zhàn)2024年新高考數(shù)學(xué)必背知識(shí)手冊(cè)
2023高考數(shù)學(xué)二輪專題 微專題49 統(tǒng)計(jì)與成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
2023高考數(shù)學(xué)三輪專題考前回顧 回顧9 統(tǒng)計(jì)與成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
微信掃碼,快速注冊(cè)
注冊(cè)成功