
1.了解隨機(jī)變量χ2的意義,通過(guò)對(duì)典型案例分析。2.了解獨(dú)立性檢驗(yàn)的基本思想和方法。
前面我們通過(guò)2×2列聯(lián)表整理成對(duì)分類變量的樣本觀測(cè)數(shù)據(jù),并根據(jù)隨機(jī)事件頻率的穩(wěn)定性推斷兩個(gè)分類變量之間是否有關(guān)聯(lián). 對(duì)于隨機(jī)樣本而言,因?yàn)轭l率具有隨機(jī)性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯(cuò)誤,而且在樣本容量較小時(shí),犯錯(cuò)誤的可能性會(huì)較大.因此,需要找到一種更為合理的推斷方法,同時(shí)也希望能對(duì)出現(xiàn)錯(cuò)誤推斷的概率有一定的控制或估算.
根據(jù)我們通過(guò)簡(jiǎn)單隨機(jī)抽樣得到了X和Y的抽樣數(shù)據(jù)列聯(lián)表,如表8.3-3所示.
對(duì)于隨機(jī)樣本,表8.3-3中的頻數(shù)a,b,c,d都是隨機(jī)變量,而表8.3-2中的響應(yīng)數(shù)據(jù)是這些隨機(jī)變量的一次觀測(cè)結(jié)果.
思考:如何基于②中的四個(gè)等式及列聯(lián)表8.3-3中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,對(duì)成對(duì)的分類變量X和Y是否相互獨(dú)立作出推斷?
顯然,分別考慮③中的四個(gè)差的絕對(duì)值很困難.我們需要找到一個(gè)既合理又能夠計(jì)算分布的統(tǒng)計(jì)量,來(lái)推斷是否成立.一般來(lái)說(shuō),若頻數(shù)的期望值較大,則③中相應(yīng)的差的絕對(duì)值也會(huì)較大;而若頻數(shù)的期望值較小,則③中相應(yīng)的差的絕對(duì)值也會(huì)較小.為了合理地平衡這種影響,我們將四個(gè)差的絕對(duì)值取平方后分別除以相應(yīng)的期望值再求和,得到如下的統(tǒng)計(jì)量:
思考:例1和例2都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結(jié)論,你能說(shuō)明其中的原因嗎?
事實(shí)上,如前所述,例1只是根據(jù)一個(gè)樣本的兩個(gè)頻率間存在差異得出兩校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀率有差異的結(jié)論,并沒(méi)有考慮由樣本隨機(jī)性可能導(dǎo)致的錯(cuò)誤,所以那里的推斷依據(jù)不太充分.
解:零假設(shè)為H0:療法與療效獨(dú)立,即兩種療法效果沒(méi)有差異.
將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,如表8.3-5所示. 表8.3-5 單位:人
表8.3-6 單位:人
解:零假設(shè)為H0:吸煙與患肺癌之間無(wú)關(guān)聯(lián).
總結(jié)上面的例子,應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問(wèn)題大致應(yīng)包括以下幾個(gè)主要環(huán)節(jié):
(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問(wèn)題中的解釋.
(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.
(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過(guò)比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.
注意,上述幾個(gè)環(huán)節(jié)的內(nèi)容可以根據(jù)不同情況進(jìn)行調(diào)整例如,在有些時(shí)候,分類變量的抽樣數(shù)據(jù)列聯(lián)表是問(wèn)題中給定的.
思考:獨(dú)立性檢驗(yàn)的思想類似于我們常用的反證法,你能指出二者之間的相同和不同之處嗎?
簡(jiǎn)單地說(shuō),反證法是在某種假設(shè)H0之下,推出一個(gè)矛盾結(jié)論,從而證明H0不成立;而獨(dú)立性檢驗(yàn)是在零假設(shè)H0之下,如果出現(xiàn)一個(gè)與H0相矛盾的小概率事件,就推斷不成立,且該推斷犯錯(cuò)誤的概率不大于這個(gè)小概率.另外,在全部邏輯推理正確的情況下,反證法不會(huì)犯錯(cuò)誤,但獨(dú)立性檢驗(yàn)會(huì)犯隨機(jī)性錯(cuò)誤.
1. 小概率值α的臨界值:忽略χ2的實(shí)際分布與該近似分布的誤差后,對(duì)于任何小概率值α,可以找到相應(yīng)的正實(shí)數(shù)xα,使得P(χ2 ≥xα)=α成立. 我們稱xα為α的臨界值,這個(gè)臨界值就可作為判斷χ2大小的標(biāo)準(zhǔn),概率值α越小,臨界值xα越大.
3. 基于小概率值α的檢驗(yàn)規(guī)則是:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)α;當(dāng)χ2
這是一份數(shù)學(xué)選擇性必修 第三冊(cè)8.3 分類變量與列聯(lián)表教學(xué)課件ppt,共24頁(yè)。PPT課件主要包含了該表達(dá)式可化簡(jiǎn)為等內(nèi)容,歡迎下載使用。
這是一份高中數(shù)學(xué)人教A版 (2019)選擇性必修 第三冊(cè)第八章 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析8.3 分類變量與列聯(lián)表集體備課課件ppt,共51頁(yè)。PPT課件主要包含了自學(xué)導(dǎo)引,臨界值,獨(dú)立性檢驗(yàn),預(yù)習(xí)自測(cè),答案4722,課堂互動(dòng),素養(yǎng)達(dá)成,答案BD等內(nèi)容,歡迎下載使用。
這是一份高中數(shù)學(xué)人教A版 (2019)選擇性必修 第三冊(cè)8.3 分類變量與列聯(lián)表集體備課課件ppt,共10頁(yè)。PPT課件主要包含了復(fù)習(xí)回顧,新課導(dǎo)入,問(wèn)題情境,新知探究,概念生成,典例解析,鞏固練習(xí),方法歸納,課堂小結(jié)等內(nèi)容,歡迎下載使用。
微信掃碼,快速注冊(cè)
注冊(cè)成功