
(1)了解分類變量與數(shù)值變量的區(qū)別.
(2)了解回歸與相關(guān)的區(qū)別.
(3)通過實(shí)例,理解通過比較相關(guān)比率,利用2×2列聯(lián)表或等高圖可以初步檢驗(yàn)兩個隨機(jī)變量的獨(dú)立性.
(4)通過對建立回歸分析模型步驟的回憶,獲得分析統(tǒng)計案例的一般性過程;能夠?qū)⒀芯拷y(tǒng)計案例的一般化步驟應(yīng)用到新的統(tǒng)計案例中.
(5)理解通過比較相關(guān)比率判斷隨機(jī)變量獨(dú)立性得到的結(jié)果有可能會犯錯誤.
重點(diǎn)難點(diǎn)
1.重點(diǎn):
通過案例的分析研究,展現(xiàn)統(tǒng)計中數(shù)據(jù)分析的全過程.
讓學(xué)生體會分析分類變量關(guān)聯(lián)性的方法,并意識到這種分析得到的結(jié)果有可能是錯誤的.
2.難點(diǎn):分析清楚回歸與相關(guān)的區(qū)別.
課前預(yù)習(xí) 自主梳理
知識點(diǎn)一 分類變量
為了表述方便,我們經(jīng)常會使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為分類變量.
分類變量的取值可以用實(shí)數(shù)表示.
知識點(diǎn)二 2×2列聯(lián)表
1.2×2列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù).
2.定義一對分類變量X和Y,我們整理數(shù)據(jù)如下表所示:
像這種形式的數(shù)據(jù)統(tǒng)計表稱為2×2列聯(lián)表.
知識點(diǎn)三 獨(dú)立性檢驗(yàn)
1.定義:利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”.簡稱獨(dú)立性檢驗(yàn).
2.χ2=eq \f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),其中n=a+b+c+d.
3.獨(dú)立性檢驗(yàn)解決實(shí)際問題的主要環(huán)節(jié)
(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問題中的解釋.
(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值,并與臨界值xα比較.
(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.
(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.
自主檢測
1.判斷正誤,正確的畫“√”,錯誤的畫“×”.
分類變量中的變量與函數(shù)中的變量是同一概念.( )
列聯(lián)表中的數(shù)據(jù)是兩個分類變量的頻數(shù).( )
列聯(lián)表、頻率分析法、等高條形圖都可初步分析兩分類變量是否有關(guān)系.( )
2×2列聯(lián)表只有4個格子.( )
χ2的大小是判斷事件A與B是否相關(guān)的統(tǒng)計量.( )
當(dāng)χ2≥3.841時有95%的把握說事件A與B有關(guān).( )
【答案】(1)×(2)√(3)√(4)×(5)√(6)√
2.下列關(guān)于獨(dú)立性檢驗(yàn)的敘述:
①常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征;
②獨(dú)立性檢驗(yàn)依據(jù)小概率原理;
③樣本不同,獨(dú)立性檢驗(yàn)的結(jié)論可能有差異;
④對分類變量與的隨機(jī)變量的觀測值來說,越小,與有關(guān)系的把握程度就越大.
其中正確的個數(shù)為
A.1B.2C.3D.4
【答案】C
【詳解】分析:根據(jù)獨(dú)立性檢驗(yàn)的定義及思想,可得結(jié)論.
詳解:①常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征;正確;
②獨(dú)立性檢驗(yàn)依據(jù)小概率原理;正確;
③樣本不同,獨(dú)立性檢驗(yàn)的結(jié)論可能有差異;正確;
④對分類變量與的隨機(jī)變量的觀測值來說,越大,與有關(guān)系的把握程度就越大.故④錯誤.
故選C.
點(diǎn)睛:本題考查了獨(dú)立性檢驗(yàn)的原理,考查了推理能力,屬于基礎(chǔ)題.
3.隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡單隨機(jī)抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.
計算得,.
參照下表,
下列結(jié)論正確的是( )
A.在犯錯誤的概率不超過的前提下,認(rèn)為“生育意愿與城市級別有關(guān)”
B.在犯錯誤的概率不超過的前提下,認(rèn)為“生育意愿與城市級別無關(guān)”
C.有以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”
D.有以上的把握認(rèn)為“生育意愿與城市級別無關(guān)”
【答案】C
【分析】根據(jù)的值與臨界值比較即可判斷進(jìn)而可得正確選項(xiàng).
【詳解】因?yàn)椋杂幸陨系陌盐照J(rèn)為“生育意愿與城市級別有關(guān)”,
故選項(xiàng)A、B、D不正確,
故選:C.
4.某學(xué)校為了制定治理學(xué)校門口上學(xué)、放學(xué)期間家長接送孩子亂停車現(xiàn)象的措施,對全校學(xué)生家長進(jìn)行了問卷調(diào)查.根據(jù)從中隨機(jī)抽取的50份調(diào)查問卷,得到了如下的列聯(lián)表:
附:
則認(rèn)為“是否同意限定區(qū)域停車與家長性別有關(guān)”的把握約為( )
A.0. 1%B.0.5%C.99.5%D.99.9%
【答案】C
【分析】根據(jù)獨(dú)立性檢驗(yàn)的公式得,進(jìn)而根據(jù)表格即可得答案.
【詳解】由題中數(shù)據(jù)可得.
又查表可得,
所以“是否同意限定區(qū)域停車與家長性別有關(guān)”的把握約為99.5%.
故選:C.
5.為大力提倡“厲行節(jié)約,反對浪費(fèi)”,某市通過隨機(jī)詢問100名性別不同的居民是否能做到“光盤”行動,得到如下列聯(lián)表:
附:
參照附錄,得到的正確結(jié)論是( )
A.在犯錯誤的概率不超過的前提下,認(rèn)為“該市居民能否做到‘光盤’與性別有關(guān)”
B.在犯錯誤的概率不超過的前提下,認(rèn)為“該市居民能否做到‘光盤’與性別有關(guān)”
C.有以上的把握認(rèn)為“該市居民能否做到‘光盤’與性別無關(guān)”
D.有以上的把握認(rèn)為“該市居民能否做到‘光盤’與性別有關(guān)”
【答案】D
【分析】由獨(dú)立性檢驗(yàn)的方法,算出,參照附表即可
【詳解】,
參照附表,得到的正確結(jié)論是有90%以上的把握認(rèn)為“該市居民能否做到‘光盤’與性別有關(guān)”.
故選:D
新課導(dǎo)學(xué)
學(xué)習(xí)探究
環(huán)節(jié)一 創(chuàng)設(shè)情境,引入課題
飲用水的質(zhì)量是人類普遍關(guān)心的問題.根據(jù)統(tǒng)計,飲用優(yōu)質(zhì)水的518人中,身體狀況優(yōu)秀的有466人,飲用一般水的312人中,身體狀況優(yōu)秀的有218人.問題人的身體健康狀況與飲用水的質(zhì)量之間有關(guān)系嗎?
提示我們可以根據(jù)2×2列聯(lián)表來判斷人的身體健康狀況與飲用水的質(zhì)量之間的關(guān)系.也就是本節(jié)課所要學(xué)習(xí)的內(nèi)容.
前面兩節(jié)所討論的變量,如人的身高、樹的胸徑、樹的高度、短跑100m世界紀(jì)錄和創(chuàng)紀(jì)錄的時間等,都是數(shù)值變量.?dāng)?shù)值變量的取值為實(shí)數(shù),其大小和運(yùn)算都有實(shí)際含義.
在現(xiàn)實(shí)生活中,人們經(jīng)常需要回答一定范圍內(nèi)的兩種現(xiàn)象或性質(zhì)之間是否存在關(guān)聯(lián)性或相互影響的問題.例如,就讀不同學(xué)校是否對學(xué)生的成績有影響,不同班級學(xué)生用于體育鍛煉的時間是否有差別,吸煙是否會增加患肺癌的風(fēng)險,等等.本節(jié)將要學(xué)習(xí)的獨(dú)立性檢驗(yàn)方法為我們提供了解決這類問題的方案.
在討論上述問題時,為了表述方便,我們經(jīng)常會使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為分類變量.
分類變量的取值可以用實(shí)數(shù)表示,例如,學(xué)生所在的班級可以用1,2,3等表示,男性、女性可以用1,0表示,等等.在很多時候,這些數(shù)值只作為編號使用,并沒有通常的大小和運(yùn)算意義.本節(jié)我們主要討論取值于{0,1}的分類變量的關(guān)聯(lián)性問題.
如何利用統(tǒng)計數(shù)據(jù)判斷一對分類變量之間是否具有關(guān)聯(lián)性呢?對于這樣的統(tǒng)計問題,有時可以利用普查數(shù)據(jù),通過比較相關(guān)的比率給出問題的準(zhǔn)確回答,但在大多數(shù)情況下,需要借助概率的觀點(diǎn)和方法.我們先看下面的具體問題.
【設(shè)計意圖】理解數(shù)值變量與分類變量的區(qū)別對理解回歸分析法與相關(guān)分析法的區(qū)別起著至關(guān)要的作用,概念解析1的設(shè)計意圖即是幫助理解回歸分析法與相關(guān)分析法的區(qū)別,為突破這一教學(xué)難點(diǎn)做鋪墊.
問題 為了有針對性地提高學(xué)生體育鍛煉的積極性,某中學(xué)需要了解性別因素是否對本校學(xué)生體育鍛煉的經(jīng)常性有影響,為此對學(xué)生是否經(jīng)常鍛煉的情況進(jìn)行了普查.全校學(xué)生的普查數(shù)據(jù)如下:523名女生中有331名經(jīng)常鍛煉;601名男生中有473名經(jīng)常鍛煉.你能利用這些數(shù)據(jù),說明該校女生和男生在體育鍛煉的經(jīng)常性方面是否存在差異嗎?
這是一個簡單的統(tǒng)計問題.最直接的解答方法是,比較經(jīng)常鍛煉的學(xué)生在女生和男生中的比率.為了方便,我們設(shè)
,.
那么,只要求出和的值,通過比較這兩個值的大小,就可以知道女生和男生在鍛煉的經(jīng)常性方面是否有差異,由所給的數(shù)據(jù),經(jīng)計算得到
,.
由
可知,男生經(jīng)常鍛煉的比率比女生高出15.4個百分點(diǎn),所以該校的女生和男生在體育鍛煉的經(jīng)常性方面有差異,而且男生更經(jīng)常鍛煉.
【設(shè)計意圖】給出本節(jié)課第一個重點(diǎn),判斷兩個分類變量之間關(guān)聯(lián)關(guān)系的方法1—頻率分析法.
環(huán)節(jié)二 觀察分析,感知概念
上面的問題還可以通過建立一個古典概型,使用條件概率的語言,給出另外一種解答方法.用表示該校全體學(xué)生構(gòu)成的集合,這是我們所關(guān)心的對象的總體.考慮以為樣本空間的古典概型,并定義一對分類變量X和Y如下:對于中的每一名學(xué)生,分別令
.
【設(shè)計意圖】給出本節(jié)課第二個重點(diǎn),判斷兩個分類變量之間關(guān)聯(lián)關(guān)系方法1的另外一種表述方法—使用條件概率的語言,給出解答.
環(huán)節(jié)三 抽象概括,形成概念
我們希望通過比較條件概率和回答上面的問題.按照條件概率的直觀解釋,如果從該校女生和男生中各隨機(jī)選取一名學(xué)生,那么該女生屬于經(jīng)常鍛煉群體的概率是,而該男生屬于經(jīng)常鍛煉群體的概率是.因此,“性別對體育鍛煉的經(jīng)常性沒有影響”可以描述為
;
而“性別對體育鍛煉的經(jīng)常性有影響”可以描述為
.
為了清楚起見,我們用表格整理數(shù)據(jù),如表8.3-1所示.
表8.3-1 單位:人
【設(shè)計意圖】給出本節(jié)課第三個重點(diǎn),舉例說明什么是2×2列聯(lián)表.
我們用表示事件和的積事件,用表示事件和的積事件.根據(jù)古典概型和條件概率的計算公式,我們有
,
.
由大于可以做出判斷,在該校的學(xué)生中,性別對體育鍛煉的經(jīng)常性有影響,即該校的女生和男生在體育鍛煉的經(jīng)常性方面存在差異,而且男生更經(jīng)常鍛煉.
環(huán)節(jié)四 辨析理解 深化概念
在實(shí)踐中,由于保存原始數(shù)據(jù)的成本較高,人們經(jīng)常按研究問題的需要,將數(shù)據(jù)分類統(tǒng)計,并做成表格加以保存.我們將如表8.3-1這種形式的數(shù)據(jù)統(tǒng)計表稱為列聯(lián)表(cntingency table).
列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù).以表8.3-1為例,它包含了X和Y的如下信息:最后一行的前兩個數(shù)分別是事件和中樣本點(diǎn)的個數(shù);最后一列的前兩個數(shù)分別是事件和中樣本點(diǎn)的個數(shù);中間的四個格中的數(shù)是表格的核心部分,給出了事件中樣本點(diǎn)的個數(shù);右下角格中的數(shù)是樣本空間中樣本點(diǎn)的總數(shù).
在上面問題的兩種解答中,使用了學(xué)校全部學(xué)生的調(diào)查數(shù)據(jù),利用這些數(shù)據(jù)能夠完全確定解答問題所需的比率和條件概率.然而,對于大多數(shù)實(shí)際問題,我們無法獲得所關(guān)心的全部對象的數(shù)據(jù),因此無法準(zhǔn)確計算出有關(guān)的比率或條件概率.在這種情況下,上述古典概型和條件概率的觀點(diǎn)為我們提供了一個解決問題的思路.比較簡單的做法是利用隨機(jī)抽樣獲得一定數(shù)量的樣本數(shù)據(jù),再利用隨機(jī)事件發(fā)生的頻率穩(wěn)定于概率的原理對問題答案作出推斷.
將所關(guān)心的對象的體看成古典概型的樣本空間,就可以用概率的語言刻畫相關(guān)的問題,進(jìn)而用頻率穩(wěn)定于概率的原理推斷問題的答案.很多統(tǒng)計方法都是基于這種思想建立起來的.
將所關(guān)心的對象的全體看成古典概型的樣本空間,就可以用概率的語言刻畫相關(guān)的問題,進(jìn)而用頻率穩(wěn)定于概率的原理推斷問題的答案.很多統(tǒng)計方法都是基于這種思相建立起來的.
環(huán)節(jié)五 概念應(yīng)用,鞏固內(nèi)化
例1為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡單隨機(jī)抽樣的方法抽取88名學(xué)生.通過測驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績優(yōu)秀率之間是否存在差異.
解:用表示兩所學(xué)校的全體學(xué)生構(gòu)成的集合.考慮以為樣本空間的古典概型.
對于中每一名學(xué)生,定義分類變量和如下:
我們將所給數(shù)據(jù)整理成表8.3-2.
表8.3-2是關(guān)于分類變量和的抽樣數(shù)據(jù)的列聯(lián)表:最后一行的前兩個數(shù)分別是事件和的頻數(shù);最后一列的前兩個數(shù)分別是事件和的頻數(shù);中間的四個格中的數(shù)是事件的頻數(shù);右下角格中的數(shù)是樣本容量.因此,甲校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率分別為
和.
乙校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率分別為
和.
【設(shè)計意圖】(1)鞏固判斷兩個分類變量之間關(guān)聯(lián)關(guān)系的方法1—頻率分析法.
(2)引出判斷兩個分類變量之間關(guān)聯(lián)關(guān)系的方法1—圖形分析法.
(3)由于頻率和概率之間存在誤差,所以此例題可以說明方法一的局限性,為引出第二節(jié)課,獨(dú)立性檢驗(yàn)做鋪墊.
我們可以用等高堆積條形圖直觀地展示上述計算結(jié)果,如圖8.3-1所示.
在圖8.3-1中,左邊的藍(lán)色和紅色條的高度分別是甲校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率;右邊的藍(lán)色和紅色條的高度分別是乙校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率.
通過比較發(fā)現(xiàn),兩個學(xué)校學(xué)生抽樣數(shù)據(jù)中數(shù)學(xué)成績優(yōu)秀的頻率存在差異,甲校的頻率明顯高于乙校的頻率.依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷.
也就是說,如果從甲校和乙校各隨機(jī)選取一名學(xué)生,那么甲校學(xué)生數(shù)學(xué)成績優(yōu)秀的概率大于乙校學(xué)生數(shù)學(xué)成績優(yōu)秀的概率.因此,可以認(rèn)為兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異,甲校學(xué)生的數(shù)學(xué)成績優(yōu)秀率比乙校學(xué)生的高.
【設(shè)計意圖】給出本節(jié)課重點(diǎn),判斷兩個分類變量之間關(guān)聯(lián)關(guān)系的方法1—圖形分析法.
思考:你認(rèn)為“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯誤的?
事實(shí)上,“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這個結(jié)論是根據(jù)兩個頻率間存在差異推斷出來的.有可能出現(xiàn)這種情況:在隨機(jī)抽取的這個樣本中,兩個頻率間確實(shí)存在差異,但兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率實(shí)際上是沒有差別的.這就是說,樣本的隨機(jī)性導(dǎo)致了兩個頻率間出現(xiàn)較大差異.在這種情況下,我們推斷出的結(jié)論就是錯誤的.后面我們將討論犯這種錯誤的概率大小問題.
環(huán)節(jié)六 歸納總結(jié),反思提升
本節(jié)課學(xué)習(xí)的概念有哪些?
(1)相關(guān)關(guān)系.
(2)散點(diǎn)圖.
(3)正相關(guān)、負(fù)相關(guān)、線性相關(guān)、非線性相關(guān).
(4)樣本相關(guān)系數(shù).
2.方法歸納:數(shù)形結(jié)合.
3.常見誤區(qū):相關(guān)關(guān)系與函數(shù)關(guān)系不分,樣本相關(guān)系數(shù)絕對值的大小與相關(guān)程度的關(guān)系.
環(huán)節(jié)七目標(biāo)檢測,作業(yè)布置
完成教材:教材第127頁練習(xí)第4題.
備用練習(xí)
1.為了考查某種病毒疫苗的效果,現(xiàn)隨機(jī)抽取100只小白鼠進(jìn)行試驗(yàn),得到如下2×2列聯(lián)表:
附:,其中.
根據(jù)以上數(shù)據(jù),得到的結(jié)論正確的是( )
A.在犯錯誤的概率不超過2.5%的前提下,認(rèn)為“小白鼠是否被感染與有沒有服用疫苗有關(guān)”
B.在犯錯誤的概率不超過2.5%的前提下,認(rèn)為“小白鼠是否被感染與有沒有服用疫苗無關(guān)”
C.有95%的把握認(rèn)為“小白鼠是否被感染與有沒有服用疫苗有關(guān)”
D.有95%的把握認(rèn)為“小白鼠是否被感染與有沒有服用疫苗無關(guān)”
【答案】C
【分析】根據(jù)給定的列聯(lián)表,計算出的觀測值,再與臨界值比對作答.
【詳解】依題意,,
顯然有,
所以有95%的把握認(rèn)為“小白鼠是否被感染與有沒有服用疫苗有關(guān)”,選項(xiàng)A,B,D不正確,C正確.
故選:C
2.已知某產(chǎn)品連續(xù)4個月的廣告費(fèi)用(千元)與銷售額(萬元),經(jīng)過對這些數(shù)據(jù)的處理,得到如下數(shù)據(jù)信息:
①廣告費(fèi)用和銷售額之間具有較強(qiáng)的線性相關(guān)關(guān)系;
②;
③回歸直線方程中的=0.8(用最小二乘法求得);
那么,廣告費(fèi)用為8千元時,可預(yù)測銷售額約為( )
A.4.5萬元B.4.9萬元C.6.3萬元D.6.5萬元
【答案】C
【分析】由已知可求出,進(jìn)而可求出,即可得到回歸方程,令,可求出答案.
【詳解】由題意,,
因?yàn)椋裕?br>則回歸直線方程為.
當(dāng)時,.
故選C.
【點(diǎn)睛】本題考查了線性回歸方程的求法,考查了計算能力,屬于基礎(chǔ)題.
3.以下四個命題,其中正確的個數(shù)有( )
①由獨(dú)立性檢驗(yàn)可知,有的把握認(rèn)為物理成績與數(shù)學(xué)成績有關(guān),某人數(shù)學(xué)成績優(yōu)秀,則他有的可能物理優(yōu)秀.
②兩個隨機(jī)變量相關(guān)性越強(qiáng),則相關(guān)系數(shù)的絕對值越接近于;
③在線性回歸方程中,當(dāng)解釋變量每增加一個單位時,預(yù)報變量平均增加個單位;
④對分類變量與,它們的隨機(jī)變量的觀測值來說,越小,“與有關(guān)系”的把握程度越大.
A.1B.2C.3D.4
【答案】B
【分析】根據(jù)獨(dú)立性檢驗(yàn)的定義判斷①、④,根據(jù)相關(guān)系數(shù)的概念判斷②,根據(jù)回歸直線方程的性質(zhì)判斷③;
【詳解】解:對于①:認(rèn)為數(shù)學(xué)成績與物理成績有關(guān),不出錯的概率是,不是數(shù)學(xué)成績優(yōu)秀,物理成績就有的可能優(yōu)秀,不正確;
對于②:兩個隨機(jī)變量相關(guān)性越強(qiáng),則相關(guān)系數(shù)的絕對值越接近于,故正確;
對于③:在線性回歸方程中,當(dāng)解釋變量每增加一個單位時,預(yù)報變量平均增加個單位,故正確;
對于④,隨機(jī)變量的觀測值越小,說明兩個相關(guān)變量有關(guān)系的把握程度越小,不正確;
故選:B.
4.據(jù)一組樣本數(shù)據(jù),…,,求得經(jīng)驗(yàn)回歸方程為,且.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個樣本點(diǎn)和誤差較大,去除后重新求得的經(jīng)驗(yàn)回歸直線的斜率為1.2,則( )
A.去除兩個誤差較大的樣本點(diǎn)后,的估計值增加速度變快
B.去除兩個誤差較大的樣本點(diǎn)后,重新求得的回歸方程一定過點(diǎn)
C.去除兩個誤差較大的樣本點(diǎn)后,重新求得的回歸方程為
D.去除兩個誤差較大的樣本點(diǎn)后,相應(yīng)于樣本點(diǎn)的殘差為0.05
【答案】C
【分析】對A:比較原線性回歸方程的斜率和新回歸方程的斜率,即可求解;
對B:由新的樣本可求解;
對C:由線性回歸方程的性質(zhì),即可求解;
對D:利用殘差公式,即可求解.
【詳解】對A,因?yàn)椋匀コ齼蓚€誤差較大的樣本點(diǎn)后的估計值增加速度變慢,故A錯誤;
對B,當(dāng)時,,設(shè)去掉兩個誤差較大的樣本點(diǎn)后,橫坐標(biāo)的平均值為,縱坐標(biāo)的平均值為,
則,,故B錯誤;
對C,因?yàn)槿コ齼蓚€誤差較大的樣本點(diǎn)后,重新求得回歸直線的斜率為1.2,
所以,解得,
所以去除兩個誤差較大的樣本點(diǎn)后的經(jīng)驗(yàn)回歸方程為,故C正確;
對D,因?yàn)?,所以,故D錯誤.
故選:C.
5.5G技術(shù)在我國已經(jīng)進(jìn)入高速發(fā)展的階段,5G手機(jī)的銷量也逐漸上升,某手機(jī)商城統(tǒng)計了最近5個月手機(jī)的實(shí)際銷量,如下表所示:
若與線性相關(guān),且線性回歸方程為,則下列說法不正確的是( )
A.由題中數(shù)據(jù)可知,變量與正相關(guān),且相關(guān)系數(shù)
B.線性回歸方程中
C.殘差的最大值與最小值之和為0
D.可以預(yù)測時該商場手機(jī)銷量約為1.72(千只)
【答案】B
【分析】根據(jù)已知數(shù)據(jù),分析總體單調(diào)性,并注意到增量不相等,不是嚴(yán)格在一條直線上,從而判定A;求得樣本中心點(diǎn)坐標(biāo),代入已給出的回歸方程,求解,從而判定B;根據(jù)殘差定義求得各個殘差,進(jìn)而得到殘差的最大值與最小值,從而判定C;利用回歸方程預(yù)測計算即可判定D.
【詳解】從數(shù)據(jù)看y隨x的增加而增加,故變量與正相關(guān),由于各增量并不相等,故相關(guān)系數(shù),故A正確;
由已知數(shù)據(jù)易得代入中得到,故B錯誤;
,
,,,,,
,,,,,
殘差的最大值與最小值之和為0,故正確;
時該商場手機(jī)銷量約為,故D正確.
故選:B
X
Y
合計
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合計
a+c
b+d
n=a+b+c+d
非一線
一線
總計
愿生
45
20
65
不愿生
13
22
35
總計
58
42
100
0.050
0.010
0.001
3.841
6.635
10.828
同意限定區(qū)域停車
不同意限定區(qū)域停車
合計
男
20
5
25
女
10
15
25
合計
30
20
50
0.010
0.005
0.001
6.635
7.879
10.828
做不到“光盤”
能做到“光盤”
男
45
10
女
30
15
性別
鍛煉
合計
不經(jīng)常(Y=0)
經(jīng)常(Y=1)
女生(X=0)
192
331
523
男生(X=1)
128
473
601
合計
320
804
1124
學(xué)校
數(shù)學(xué)成績
合計
不優(yōu)秀(Y=0)
優(yōu)秀(Y=1)
甲校(X=0)
33
10
43
乙校(X=1)
38
7
45
合計
71
17
88
感染
未感染
總計
服用
10
40
50
未服用
20
30
50
總計
30
70
100
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
時間
1
2
3
4
5
銷售量(千只)
0.5
0.8
1.0
1.2
1.5
這是一份人教版高中數(shù)學(xué)選擇性必修第三冊8.3分類變量與列聯(lián)表同步課堂導(dǎo)學(xué)案(含答案),共18頁。學(xué)案主要包含了典例解析等內(nèi)容,歡迎下載使用。
這是一份高中數(shù)學(xué)8.3 分類變量與列聯(lián)表學(xué)案,共22頁。學(xué)案主要包含了典例解析等內(nèi)容,歡迎下載使用。
這是一份人教A版 (2019)選擇性必修 第三冊第八章 成對數(shù)據(jù)的統(tǒng)計分析8.3 分類變量與列聯(lián)表優(yōu)秀導(dǎo)學(xué)案,共7頁。學(xué)案主要包含了學(xué)習(xí)目標(biāo),自主學(xué)習(xí),小試牛刀,經(jīng)典例題,跟蹤訓(xùn)練,當(dāng)堂達(dá)標(biāo),參考答案等內(nèi)容,歡迎下載使用。
微信掃碼,快速注冊
注冊成功