
第八章 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析8.3 列聯(lián)表與獨(dú)立性檢驗(yàn)素養(yǎng)目標(biāo)?定方向必備知識(shí)?探新知 基礎(chǔ)知識(shí)分類變量用來(lái)區(qū)別不同的現(xiàn)象或性質(zhì)的隨機(jī)變量,其取值可以用實(shí)數(shù)表示.知識(shí)點(diǎn)1知識(shí)點(diǎn)22×2列聯(lián)表及隨機(jī)事件的概率(1)2×2列聯(lián)表:如果隨機(jī)事件X與Y的樣本數(shù)據(jù)如下表格形式在這個(gè)表格中,核心的數(shù)據(jù)是中間的4個(gè)格子,所以這樣的表格通常稱為2×2列聯(lián)表.(2)2×2列聯(lián)表中隨機(jī)事件的概率:如上表,記n=a+b+c+d,則事件{Y=0}發(fā)生的概率可估計(jì)為______________;事件{X=1}發(fā)生的概率可估計(jì)為______________;事件{X=1,Y=0}發(fā)生的概率可估計(jì)為____________________.事件{X=1|Y=0}發(fā)生的概率可估計(jì)為____________________.獨(dú)立性檢驗(yàn)(1)零假設(shè):設(shè)X和Y為定義在Ω上,取值于{0,1}的成對(duì)分類變量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互為對(duì)立事件,故要判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián),需要判斷假定關(guān)系__________ _____________________是否成立.通常稱H0為零假設(shè).(2)獨(dú)立性檢驗(yàn):利用隨機(jī)變量χ2來(lái)判斷“兩個(gè)分類量有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn).知識(shí)點(diǎn)3H0:P(Y=1|X=0)=P(Y=1|X=1)(4)對(duì)照表及檢驗(yàn)規(guī)則:當(dāng)χ2≥xα?xí)r就推斷“X與Y不獨(dú)立”,這種推斷犯錯(cuò)誤的概率不超過(guò)α;當(dāng)χ2<xα?xí)r,可以認(rèn)為“X與Y獨(dú)立”.關(guān)鍵能力?攻重難題型探究某學(xué)校對(duì)高三學(xué)生作了一項(xiàng)調(diào)查,發(fā)現(xiàn):在平時(shí)的模擬考試中,性格內(nèi)向的學(xué)生426人中有332人在考前心情緊張.性格外向的學(xué)生594人中有213人在考前心情緊張,作出等高堆積條形圖,利用圖形判斷考前心情緊張與性格類別是否有關(guān)系.典例1[解析] 作列聯(lián)表如下:相應(yīng)的等高條形圖如圖所示:圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內(nèi)向的人數(shù)所占的比例,從圖中可以看出考前心情緊張的樣本中性格內(nèi)向的人數(shù)占的比例比考前心情不緊張樣本中性格內(nèi)向的人數(shù)占的比例高,可以認(rèn)為考前緊張與性格類型有關(guān).(2022·山東青島一中高二期中)為了了解某高校學(xué)生喜歡使用手機(jī)支付是否與性別有關(guān),抽取了部分學(xué)生作為樣本,統(tǒng)計(jì)后作出如圖所示的等高堆積條形圖,則下列說(shuō)法正確的是 ( )A.喜歡使用手機(jī)支付與性別無(wú)關(guān)B.樣本中男生喜歡使用手機(jī)支付的約60%典例2DC.樣本中女生喜歡使用手機(jī)支付的人數(shù)比男生多D.女生比男生喜歡使用手機(jī)支付的可能性大些[解析] A錯(cuò)誤,根據(jù)等高堆積條形圖,喜歡和不喜歡使用手機(jī)支付的比例因性別差距很明顯,所以喜歡使用手機(jī)支付與性別有關(guān);B錯(cuò)誤,樣本中男生喜歡使用手機(jī)支付的約為40%;女生比男生喜歡使用手機(jī)支付的可能性大些,由于不知道男女生人數(shù),所以不能認(rèn)定女生喜歡使用手機(jī)支付的人數(shù)是否比男生多,所以C錯(cuò)誤,D正確.【對(duì)點(diǎn)訓(xùn)練】? 為了解鉛中毒病人是否有尿棕色素增加現(xiàn)象,分別對(duì)病人組和對(duì)照組的尿液做尿棕色素定性檢查,結(jié)果如下表.問(wèn):鉛中毒病人組和對(duì)照組的尿棕色素陽(yáng)性數(shù)有無(wú)差別?[解析] 由上述列聯(lián)表可知,在鉛中毒病人組中尿棕色素為陽(yáng)性的占80.56%,而鉛中毒對(duì)照組僅占24.32%.說(shuō)明它們之間有較大差別.畫出等高堆積條形圖如圖所示.由列聯(lián)表及等高堆積條形圖可知,鉛中毒病人組與對(duì)照組相比較,尿棕色素為陽(yáng)性數(shù)差別明顯,因此鉛中毒病人組和對(duì)照組的尿棕色素陽(yáng)性數(shù)有明顯差別.(2019·全國(guó)Ⅰ卷)某商場(chǎng)為提高服務(wù)質(zhì)量,隨機(jī)調(diào)查了50名男顧客和50名女顧客,每位顧客對(duì)該商場(chǎng)的服務(wù)給出滿意或不滿意的評(píng)價(jià),得到下面列聯(lián)表:典例3(1)分別估計(jì)男、女顧客對(duì)該商場(chǎng)服務(wù)滿意的概率;(2)能否有95%的把握認(rèn)為男、女顧客對(duì)該商場(chǎng)服務(wù)的評(píng)價(jià)有差異?[分析] (1)根據(jù)列聯(lián)表,用頻率代替概率,可分別估計(jì)男、女顧客對(duì)該商場(chǎng)服務(wù)滿意的概率;(2)求出χ2的值,與臨界值表對(duì)比可得結(jié)論.[規(guī)律方法] 解決獨(dú)立性檢驗(yàn)問(wèn)題的基本步驟【對(duì)點(diǎn)訓(xùn)練】? 2022年春季,某出租汽車公司決定更換一批小汽車以代替原來(lái)報(bào)廢的出租車,現(xiàn)有A,B兩款車型的使用壽命(單位:年)頻數(shù)表如下:(1)填寫下表,并判斷是否有99%的把握認(rèn)為出租車的使用壽命與汽車車型有關(guān);(2)司機(jī)師傅小李準(zhǔn)備在一輛開了4年的A型車和一輛開了4年的B型車中選擇,為了盡最大可能實(shí)現(xiàn)3年內(nèi)(含3年)不換車,試通過(guò)計(jì)算說(shuō)明,他應(yīng)如何選擇.[解析] (1)根據(jù)題目所給數(shù)據(jù)得到如下2×2的列聯(lián)表:某校鼓勵(lì)即將畢業(yè)的大學(xué)生到西部偏遠(yuǎn)地區(qū)去支教,校學(xué)生就業(yè)部針對(duì)即將畢業(yè)的男、女生是否愿意到西部支教進(jìn)行問(wèn)卷調(diào)查,得到的情況如下表所示:?典例4(1)完成上述2×2列聯(lián)表;(2)根據(jù)表中的數(shù)據(jù),試根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),分析愿意去西部支教是否與性別有關(guān)?(3)若在接受調(diào)查的所有男生中按照“是否愿意去支教”進(jìn)行分層抽樣,隨機(jī)抽取10人,再在10人中抽取3人進(jìn)行面談,記面談的男生中,不愿意去支教的人數(shù)為ξ,求ξ的分布列以及數(shù)學(xué)期望.[分析] (2)根據(jù)列聯(lián)表求出χ2和相應(yīng)的頻率,從而分析是否與性別有關(guān);(3)由超幾何分布公式求出相應(yīng)的分布列,計(jì)算出數(shù)學(xué)期望.[解析] (1)2×2列聯(lián)表如下:[規(guī)律方法] 解決一般的獨(dú)立性檢驗(yàn)問(wèn)題的步驟:【對(duì)點(diǎn)訓(xùn)練】? 某地為了調(diào)查市民對(duì)“一帶一路”倡議的了解程度,隨機(jī)選取了100名年齡在20歲至60歲的市民進(jìn)行問(wèn)卷調(diào)查,并通過(guò)問(wèn)卷的分?jǐn)?shù)把市民劃分為了解“一帶一路”倡議與不了解“一帶一路”倡議兩類,數(shù)據(jù)如表所示.(1)完成下面的2×2列聯(lián)表,并判斷是否有90%的把握認(rèn)為以40歲為分界點(diǎn)對(duì)“一帶一路”倡議的了解有差異;(結(jié)果精確到0.001)(2)以頻率估計(jì)概率,若在該地選出4名市民(年齡在20歲至60歲),記4名市民中了解“一帶一路”倡議的人數(shù)為X,求隨機(jī)變量X的分布列、數(shù)學(xué)期望和方差.附:[分析] (1)由表格讀取信息,年齡低于40歲的共60人,年齡不低于40歲的共40人,填寫2×2列聯(lián)表,再把數(shù)據(jù)代入χ2公式計(jì)算;(2)在總體未知的市民中選取4人,由頻率估計(jì)概率得出選出的每位市民是了解“一帶一路”倡議的概率,可知隨機(jī)變量X服從二項(xiàng)分布.[解析] (1)根據(jù)已知數(shù)據(jù)得到2×2列聯(lián)表:易錯(cuò)警示沒(méi)有準(zhǔn)確掌握公式中參數(shù)的含義致誤有甲、乙兩個(gè)班級(jí)進(jìn)行一門考試,按照學(xué)生考試成績(jī)優(yōu)秀和不優(yōu)秀統(tǒng)計(jì)后,得到如下的列聯(lián)表班級(jí)與成績(jī)列聯(lián)表典例5試問(wèn)能有多大把握認(rèn)為“成績(jī)與班級(jí)有關(guān)系”?[辨析] 由于對(duì)2×2列聯(lián)表中a、b、c、d的位置不清楚,在代入公式時(shí)代錯(cuò)了數(shù)值導(dǎo)致計(jì)算結(jié)果的錯(cuò)誤.[點(diǎn)評(píng)] 獨(dú)立性檢驗(yàn)中,參數(shù)χ2公式復(fù)雜計(jì)算量大,要弄清公式特點(diǎn)熟記公式,小心計(jì)算避免粗心致誤.課堂檢測(cè)?固雙基1.判斷兩個(gè)分類變量是彼此相關(guān)還是相互獨(dú)立的常用的方法中,最為精確的是 ( )A.殘差 B.獨(dú)立性檢驗(yàn)C.等高堆積條形圖 D.回歸分析[解析] 用獨(dú)立性檢驗(yàn)考查兩個(gè)分類變量是否有關(guān)系時(shí),算出隨機(jī)變量χ2的值越大,說(shuō)明“X與Y有關(guān)系”成立的可能性越大.B2.下列關(guān)于獨(dú)立性檢驗(yàn)的敘述:①常用等高堆積條形圖表示列聯(lián)表數(shù)據(jù)的頻率特征;②獨(dú)立性檢驗(yàn)依據(jù)的是小概率原理;③獨(dú)立性檢驗(yàn)的結(jié)果是完全正確的;④對(duì)分類變量X與Y的隨機(jī)變量χ2的觀測(cè)值來(lái)說(shuō),χ2越小,X與Y有關(guān)系的把握程度就越大.其中敘述正確的個(gè)數(shù)為 ( )A.1 B.2C.3 D.4B[解析] 因?yàn)楠?dú)立性檢驗(yàn)常用等高堆積條形圖表示列聯(lián)表數(shù)據(jù)的頻率特征,故①正確;獨(dú)立性檢驗(yàn)依據(jù)的是小概率原理,故②正確;獨(dú)立性檢驗(yàn)的結(jié)果不是完全正確的,故③不正確;對(duì)分類變量X與Y的隨機(jī)變量χ2的觀測(cè)值來(lái)說(shuō),χ2越大,X與Y有關(guān)系的把握程度才越大,故④不正確.所以正確的個(gè)數(shù)為2,故選B.3.(2022·河北省石家莊市期末)一個(gè)2×2列聯(lián)表如下:則表中m,n的值分別是 ( )A.10,38 B.17,45C.10,45 D.17,38[解析] 由a+35=45,得a=10.由a+7=m,得m=17.由m+73=s,得s=90.由45+n=s,得n=45.B4.下列關(guān)于χ2的說(shuō)法中正確的是 ( )A.χ2越大,“事件A,B有關(guān)”的可信度越小B.χ2越大,“事件A,B無(wú)關(guān)”的可信度越大C.χ2越小,“事件A,B有關(guān)”的可信度越小D.χ2越小,“事件A,B無(wú)關(guān)”的可信度越小[解析] χ2越大,“事件A,B有關(guān)”的可信度越大,“事件A,B無(wú)關(guān)”的可信度越?。沪?越小,“事件A,B有關(guān)”的可信度越小,“事件A,B無(wú)關(guān)”的可信度越大.C5.通過(guò)隨機(jī)詢問(wèn)110名性別不同的大學(xué)生是否愛好某項(xiàng)運(yùn)動(dòng),得到如下的列聯(lián)表:則正確的結(jié)論是 ( )A.在犯錯(cuò)誤的概率不超過(guò)0.1%的前提下,認(rèn)為“愛好該項(xiàng)運(yùn)動(dòng)與性別有關(guān)”B.在犯錯(cuò)誤的概率不超過(guò)0.1%的前提下,認(rèn)為“愛好該項(xiàng)運(yùn)動(dòng)與性別無(wú)關(guān)”C.有99%以上的把握認(rèn)為“愛好該項(xiàng)運(yùn)動(dòng)與性別有關(guān)”D.有99%以上的把握認(rèn)為“愛好該項(xiàng)運(yùn)動(dòng)與性別無(wú)關(guān)”[解析] 根據(jù)獨(dú)立性檢驗(yàn)的思想方法,正確選項(xiàng)為C.C
微信掃碼,快速注冊(cè)
注冊(cè)成功