
?4.3.2 獨立性檢驗
(教師獨具內(nèi)容)
課程標準:通過實例,了解2×2列聯(lián)表的統(tǒng)計意義、獨立性檢驗及其應(yīng)用.
教學重點:掌握2×2列聯(lián)表的方法,理解獨立性檢驗的基本思想及實施步驟.
教學難點:1.獨立性檢驗的基本思想和χ2的含義.2.解決獨立性檢驗的簡單實際問題.
知識點一 2×2列聯(lián)表
隨機事件A與B的樣本數(shù)據(jù)如下表,核心的數(shù)據(jù)是中間的4個格子,這樣的表格通常稱為2×2列聯(lián)表.
A
總計
B
a
b
a+b
c
d
c+d
總計
a+c
b+d
a+b+c+d
記n=a+b+c+d,則由表可知:
(1)事件A發(fā)生的概率可估計為P(A)=;
(2)事件B發(fā)生的概率可估計為P(B)=;
(3)事件AB發(fā)生的概率可估計為P(AB)=.
知識點二 獨立性檢驗
為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標準,我們構(gòu)造一個隨機變量χ2=,其中n=a+b+c+d為樣本容量.
任意給定一個α(稱為顯著性水平),可以找到滿足條件P(χ2≥k)=α的數(shù)k(稱為顯著性水平α對應(yīng)的分位數(shù)).若χ2≥k成立,就稱在犯錯誤的概率不超過α的前提下,可以認為A與B不獨立(也稱為A與B有關(guān));或說有1-α的把握認為A與B有關(guān).若χ23.841,故能在犯錯誤的概率不超過0.05的前提下認為“兩個學校的數(shù)學成績有差異”.
1.在研究吸煙與患肺癌的關(guān)系中,通過收集數(shù)據(jù)、整理分析數(shù)據(jù)得“吸煙與患肺癌有關(guān)”的結(jié)論,并有99%以上的把握認為這個結(jié)論是成立的,下列說法中正確的是( )
A.100個吸煙者中至少有99個患有肺癌
B.1個人吸煙,那么這個人一定患有肺癌
C.在100個吸煙者中一定有患肺癌的人
D.在100個吸煙者中可能一個患肺癌的人也沒有
答案 D
解析 獨立性檢驗的結(jié)論是一個數(shù)學統(tǒng)計量,它與實際問題中的問題的確定性是存在差異的,故A錯誤,C錯誤,D正確;χ2與概率的含義不同,有99%的把握不能說明有99%的可能,故B錯誤.故選D.
2.某工廠為了調(diào)查工人文化程度與月收入的關(guān)系,隨機抽取了部分工人,得到如下列聯(lián)表:
文化程度與月收入列聯(lián)表(單位:人)
月收入2000元以下
月收入2000元及以上
總計
高中文化以上
9
44
53
高中文化及以下
19
30
49
總計
28
74
102
由上表中數(shù)據(jù)計算得χ2=≈6.073,則認為“文化程度與月收入有關(guān)系”的把握為( )
A.1% B.99% C.2.5% D.97.5%
答案 D
解析 由于6.073>5.024,故在犯錯誤的概率不超過0.025的前提下,即有97.5%的把握認為“文化程度與月收入有關(guān)系”.
3.(多選)下列關(guān)于χ2統(tǒng)計量的說法正確的是( )
A.可以為負值
B.χ2的值越大,兩個事件有關(guān)系的把握越大
C.當χ2的值很小時,不能推定兩個事件不相關(guān)
D.χ2=
答案 BC
解析 χ2的值不可能為負值,故A錯誤;易知B正確;χ2的值很小時,只能說兩個事件的相關(guān)程度低,不能推定兩個事件不相關(guān),故C正確;χ2=
,故D錯誤.故選BC.
4.為了解某班學生喜愛打籃球是否與性別有關(guān),對該班50名學生進行了問卷調(diào)查,得到了如下的2×2列聯(lián)表:
喜愛打籃球
不喜愛打籃球
總計
男生
20
5
25
女生
10
15
25
總計
30
20
50
則在犯錯誤的概率不超過________的前提下認為喜愛打籃球與性別有關(guān)(請用百分數(shù)表示).
答案 0.5%
解析 χ2==
≈8.333>7.879,所以在犯錯誤的概率不超過0.5%的前提下認為喜愛打籃球與性別有關(guān).
5.湖北省武漢市等多個地區(qū)陸續(xù)出現(xiàn)感染新型冠狀病毒肺炎的患者,為及時有效地對疫情數(shù)據(jù)進行流行病學統(tǒng)計分析,某地研究機構(gòu)針對該地實際情況,根據(jù)該地患者是否有武漢旅行史與是否有確診病例接觸史,將新冠肺炎患者分為四類:有武漢旅行史(無接觸史),無武漢旅行史(無接觸史),有武漢旅行史(有接觸史)和無武漢旅行史(有接觸史),統(tǒng)計得到以下相關(guān)數(shù)據(jù).
(1)請將列聯(lián)表填寫完整:
有接觸史
無接觸史
總計
有武漢旅行史
27
無武漢旅行史
18
總計
27
54
(2)能否在犯錯誤的概率不超過0.025的前提下認為有武漢旅行史與有確診病例接觸史有關(guān)系?
附:χ2=,n=a+b+c+d.
P(χ2≥k)
0.15
0.10
0.05
0.025
0.010
k
2.072
2.706
3.841
5.024
6.635
解 (1)填表如下:
有接觸史
無接觸史
總計
有武漢旅行史
9
18
27
無武漢旅行史
18
9
27
總計
27
27
54
(2)χ2==6>5.024,
因此在犯錯誤的概率不超過0.025的前提下認為有武漢旅行史與有確診病例接觸史有關(guān)系.
A級:“四基”鞏固訓練
一、選擇題
1.對于隨機事件X與Y的隨機變量χ2,下列說法正確的是( )
A.χ2越大,“X與Y有關(guān)系”的可信程度越小
B.χ2越小,“X與Y有關(guān)系”的可信程度越小
C.χ2越接近于0,“X與Y沒有關(guān)系”的可信程度越小
D.χ2越大,“X與Y沒有關(guān)系”的可信程度越大
答案 B
解析 χ2越大,“X與Y沒有關(guān)系”的可信程度越小,則“X與Y有關(guān)系”的可信程度越大.即χ2越小,“X與Y有關(guān)系”的可信程度越?。蔬xB.
2.利用獨立性檢驗對兩個隨機事件是否有關(guān)系進行研究時,若有99.5%的把握認為事件A和B有關(guān)系,則具體計算出的數(shù)據(jù)應(yīng)該是( )
A.χ2≥6.635 B.χ23.841,說明有95%的把握認為選修統(tǒng)計專業(yè)與性別有關(guān),即有5%的把握認為選修統(tǒng)計專業(yè)與性別無關(guān),也就是“選修統(tǒng)計課程與性別有關(guān)”出錯的可能性為5%.
4.利用獨立性檢驗的方法調(diào)查高中生的寫作水平與喜好閱讀是否有關(guān),通過隨機詢問120名高中生是否喜好閱讀,利用2×2列聯(lián)表,由計算可得χ2=4.236.
α=P(χ2≥k)
0.1
0.05
0.025
0.01
0.001
k
2.706
3.841
5.024
6.635
10.828
參照附表,可得正確的結(jié)論是( )
A.有95%的把握認為“寫作水平與喜好閱讀有關(guān)”
B.有97.5%的把握認為“寫作水平與喜好閱讀有關(guān)”
C.有95%的把握認為“寫作水平與喜好閱讀無關(guān)”
D.有97.5%的把握認為“寫作水平與喜好閱讀無關(guān)”
答案 A
解析 ∵4.236>3.841,∴有95%的把握認為“寫作水平與喜好閱讀有關(guān)”.故選A.
5.某單位為了了解員工喜歡戶外運動是否與性別有關(guān),隨機抽取了50人進行調(diào)查,數(shù)據(jù)如下表:
喜歡戶外運動
不喜歡戶外運動
總計
男性
18
9
27
女性
8
15
23
總計
26
24
50
則認為喜歡戶外運動與性別有關(guān)系的把握大約為( )
A.99% B.95%
C.90% D.無充分依據(jù)
答案 B
解析 由表中數(shù)據(jù)得χ2=≈5.059>3.841,所以約有95%的把握認為兩變量之間有關(guān)系.
二、填空題
6.某電視臺在一次對收看文藝節(jié)目和新聞節(jié)目觀眾的抽樣調(diào)查中,隨機抽取了100名電視觀眾,相關(guān)的數(shù)據(jù)如下表所示:
文藝節(jié)目
新聞節(jié)目
總計
20至40歲
40
18
58
大于40歲
15
27
42
總計
55
45
100
由表中數(shù)據(jù)直觀分析,收看新聞節(jié)目的觀眾是否與年齡有關(guān)?________(填“是”或“否”).
答案 是
解析 因為在20歲至40歲的58名觀眾中有18名觀眾收看新聞節(jié)目,而大于40歲的42名觀眾中有27名觀眾收看新聞節(jié)目,即=,=,兩者相差較大,所以經(jīng)直觀分析,收看新聞節(jié)目的觀眾與年齡是有關(guān)的.
7.在2×2列聯(lián)表中,若每個數(shù)據(jù)變?yōu)樵瓉淼?倍,則χ2的值變?yōu)樵瓉淼腳_______倍.
答案 2
解析 公式χ2=中所有值變?yōu)樵瓉淼?倍,則=2χ2,故χ2也變?yōu)樵瓉淼?倍.
8.為考察某種藥物預防疾病的效果,進行動物試驗,得到如下藥物效果與動物試驗列聯(lián)表:
患病
未患病
總計
服用藥
10
45
55
沒服用藥
20
30
50
總計
30
75
105
則________(填“能”或“不能”)在犯錯誤的概率不超過0.025的前提下認為藥物有效.
附:χ2=;
P(χ2≥k)
0.05
0.025
0.010
0.005
k
3.841
5.024
6.635
7.879
答案 能
解析 根據(jù)列聯(lián)表,計算χ2==≈6.109>5.024,所以能在犯錯誤的概率不超過0.025的前提下認為藥物有效.
三、解答題
9.高中流行這樣一句話“文科就怕數(shù)學不好,理科就怕英語不好”,下表是一次針對高三文科學生的調(diào)查所得的數(shù)據(jù):
總成績好
總成績不好
合計
數(shù)學成績好
478
a
490
數(shù)學成績不好
399
24
423
合計
b
c
913
(1)計算a,b,c的值;
(2)文科學生總成績不好與數(shù)學成績不好有關(guān)系嗎?
解 (1)由478+a=490,得a=12.
由a+24=c,得c=12+24=36.
由b+c=913,得b=913-36=877.
(2)計算隨機變量χ2=≈6.233>5.024,
因為P(χ2≥5.024)=0.025,
所以有97.5%的把握認為文科學生總成績不好與數(shù)學成績不好有關(guān)系.
10.電視傳媒公司為了了解某地區(qū)電視觀眾對某類體育節(jié)目的收視情況,隨機抽取了100名觀眾進行調(diào)查.下面是根據(jù)調(diào)查結(jié)果繪制的觀眾日均收看該體育節(jié)目時間的頻率分布直方圖:
將日均收看該體育節(jié)目時間不低于40分鐘的觀眾稱為“體育迷”.
根據(jù)已知條件完成下面的2×2列聯(lián)表,并據(jù)此資料,你是否認為“體育迷”與性別有關(guān)?
非體育迷
體育迷
合計
男
女
10
55
合計
解 由所給的頻率分布直方圖知,“體育迷”人數(shù)為100×(10×0.020+10×0.005)=25.
“非體育迷”人數(shù)為75,則據(jù)題意完成2×2列聯(lián)表:
非體育迷
體育迷
合計
男
30
15
45
女
45
10
55
合計
75
25
100
將2×2列聯(lián)表的數(shù)據(jù)代入公式計算:
χ2=≈3.030>2.706.
所以在犯錯誤的概率不超過0.10的前提下可以認為“體育迷”與性別有關(guān).
B級:“四能”提升訓練
1.(多選)有兩個變量X與Y,其2×2列聯(lián)表如下所示:
其中a為正整數(shù),若有95%以上的把握認為X與Y之間有關(guān)系,則a的值可以為( )
A.7 B.8 C.9 D.10
答案 BCD
解析 令χ2==3.841,解得a≈7.688或a≈1.543.由題意知χ2>3.841,所以只要a>7.688,就有95%以上的把握認為X與Y之間有關(guān)系,又a∈N*.故選BCD.
2.甲、乙兩臺機床生產(chǎn)同一型號零件.記生產(chǎn)的零件的尺寸為t(cm),相關(guān)行業(yè)質(zhì)檢部門規(guī)定:若t∈(2.9,3.1],則該零件為優(yōu)等品;若t∈(2.8,2.9]∪(3.1,3.2],則該零件為中等品;其余零件為次品.現(xiàn)分別從甲、乙機床生產(chǎn)的零件中各隨機抽取50件,經(jīng)質(zhì)量檢測得到下表數(shù)據(jù):
(1)設(shè)生產(chǎn)每件產(chǎn)品的利潤為:優(yōu)等品3元,中等品1元,次品虧本1元.若將頻率視為概率,試根據(jù)樣本估計總體的思想,估算甲機床生產(chǎn)一件零件的利潤的數(shù)學期望;
(2)對于這兩臺機床生產(chǎn)的零件,在排除其他因素影響的情況下,試根據(jù)樣本估計總體的思想,估計約有多大的把握認為“零件優(yōu)等與否和所用機床有關(guān)”,并說明理由.
參考公式:χ2=
參考數(shù)據(jù):
P(χ2≥k)
0.25
0.15
0.10
0.05
0.025
0.010
k
1.323
2.072
2.706
3.841
5.024
6.635
解 (1)設(shè)甲機床生產(chǎn)一件零件獲得的利潤為X元,它的分布列為
X
3
1
-1
P
0.8
0.14
0.06
則有E(X)=3×0.8+1×0.14+(-1)×0.06=2.48.
所以甲機床生產(chǎn)一件零件的利潤的數(shù)學期望為2.48元.
(2)由表中數(shù)據(jù)可知,甲機床優(yōu)等品40件,非優(yōu)等品10件;乙機床優(yōu)等品30件,非優(yōu)等品20件.
制作2×2列聯(lián)表如下:
甲機床
乙機床
合計
優(yōu)等品
40
30
70
非優(yōu)等品
10
20
30
合計
50
50
100
計算χ2==≈4.762.
考察參考數(shù)據(jù)并注意到3.841
這是一份高中數(shù)學人教B版 (2019)選擇性必修 第二冊4.3.1 一元線性回歸模型學案設(shè)計,共23頁。
這是一份數(shù)學選擇性必修 第二冊4.2.5 正態(tài)分布導學案及答案,共13頁。
這是一份人教B版 (2019)選擇性必修 第二冊4.2.4 隨機變量的數(shù)字特征第2課時導學案,共13頁。
注冊成功