
選擇性必修三 第八章 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析 知識(shí)點(diǎn)清單 一、本章思維導(dǎo)圖 §8.1 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性 相關(guān)關(guān)系: 兩個(gè)變量有關(guān)系,但又沒(méi)有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這種關(guān)系稱為相關(guān)關(guān)系. 相關(guān)關(guān)系是一種不確定性關(guān)系;相關(guān)關(guān)系是相對(duì)于函數(shù)關(guān)系而言的. 像這樣,兩個(gè)變量有關(guān)系,但又沒(méi)有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這種關(guān)系稱為相關(guān)關(guān)系. 相關(guān)關(guān)系與函數(shù)關(guān)系的異同點(diǎn) 2.散點(diǎn)圖: 成對(duì)樣本數(shù)據(jù)都可用直角坐標(biāo)系中的點(diǎn)表示出來(lái),由這些點(diǎn)組成了統(tǒng)計(jì)圖.我們我們把這樣的統(tǒng)計(jì)圖叫做散點(diǎn)圖。 3.相關(guān)關(guān)系分類(lèi): 正相關(guān):當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)增加的趨勢(shì),就稱這兩個(gè)變量正相關(guān); 負(fù)相關(guān):當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)減小的趨勢(shì),就稱這兩個(gè)變量負(fù)相關(guān). 4.線性相關(guān): 如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條直線附近,就稱這兩個(gè)變量線性相關(guān). 5.樣本相關(guān)系數(shù): (1) (2)樣本相關(guān)系數(shù)的數(shù)字特征: 當(dāng)時(shí),稱成對(duì)樣本數(shù)據(jù)正相關(guān); 當(dāng)時(shí),稱成對(duì)樣本數(shù)據(jù)負(fù)相關(guān); 當(dāng)越接近1時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng); 當(dāng)越接近0時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越弱. 線性相關(guān)系數(shù)是從數(shù)值上來(lái)判斷變量間的線性相關(guān)程度,是定量的方法.與散點(diǎn)圖相比較,線性相關(guān)系數(shù)要精細(xì)得多,需要注意的是線性相關(guān)系數(shù)r的絕對(duì)值小,只是說(shuō)明線性相關(guān)程度低,但不一定不相關(guān),可能是非線性相關(guān). 利用相關(guān)系數(shù)r來(lái)檢驗(yàn)線性相關(guān)顯著性水平時(shí),通常與0.75作比較,若|r|>0.75,則線性相關(guān)較為顯著,否則不顯著. §8.2 一元線性回歸模型及其應(yīng)用 1.一元線性回歸模型: 稱為因變量或響應(yīng)變量,稱為自變量或解釋變量,為截距參數(shù),為斜率參數(shù),是與之間的隨機(jī)誤差. 2.經(jīng)驗(yàn)回歸方程: (1)相關(guān)概念: 經(jīng)驗(yàn)回歸直線:經(jīng)驗(yàn)回歸方程也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,圖形稱為經(jīng)驗(yàn)回歸直線. 最小二乘估計(jì):求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的叫做的最小二乘估計(jì). 殘差:對(duì)于響應(yīng)變量,通過(guò)觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值,通過(guò)經(jīng)驗(yàn)回歸方程得到的稱為預(yù)測(cè)值,觀測(cè)值減去預(yù)測(cè)值稱為殘差. (2) (3)決定系數(shù): 越大,表示殘差平方和越小,即模型的擬合效果越好; 越小,表示殘差平方和越大,即模型的擬合效果越差; 3.方法技巧 經(jīng)驗(yàn)回歸方程的求法及應(yīng)用 在散點(diǎn)圖中,樣本點(diǎn)大致分布在一條直線附近,利用公式求出, 可寫(xiě)出經(jīng)驗(yàn)回歸方程,利用經(jīng)驗(yàn)回歸模型進(jìn)行研究,可近似地利用經(jīng)驗(yàn)回歸方程來(lái)預(yù)測(cè) 。 4.方法技巧 一元線性回歸模型擬合問(wèn)題的求解策略 在一元線性回歸模型中,R2與相關(guān)系數(shù)r都能刻畫(huà)模型擬合數(shù)據(jù)的效果.|r|越大,R2就越大,用模型擬合數(shù)據(jù)的效果就越好. §8.3 列聯(lián)表與獨(dú)立性檢驗(yàn) 1.分類(lèi)變量:現(xiàn)實(shí)生活中,人們經(jīng)常需要回答一定范圍內(nèi)的兩種現(xiàn)象或性質(zhì)之間是否存在關(guān)聯(lián)性或相互影響的問(wèn)題,為了表述方便,我們經(jīng)常會(huì)使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類(lèi)隨機(jī)變量稱為分類(lèi)變量. 2.列聯(lián)表: 3.獨(dú)立性檢驗(yàn): (1)零假設(shè)(原假設(shè)):,即分類(lèi)變量和獨(dú)立. (2)獨(dú)立性檢驗(yàn): ① ②臨界值:對(duì)于小概率值,可以找到相應(yīng)的正實(shí)數(shù),使下面關(guān)系成立:,我們稱為的臨界值. 常用小概率值和相應(yīng)的臨界值表: ③基于小概率值的檢驗(yàn)規(guī)則: 當(dāng)時(shí),我們就推斷不成立,即認(rèn)為和不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò). 當(dāng)時(shí),我們沒(méi)有充分證據(jù)推斷不成立,可以認(rèn)為和獨(dú)立. 這種利用的取值推斷分類(lèi)變量和是否獨(dú)立的方法稱為獨(dú)立性檢驗(yàn),簡(jiǎn)稱獨(dú)立性檢驗(yàn). 4.方法技巧 獨(dú)立性檢驗(yàn)的一般步驟 (1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表; (2)根據(jù)公式計(jì)算χ2; (3)比較χ2與臨界值xα的大小關(guān)系,得到推斷結(jié)論. 關(guān)系 項(xiàng)目函數(shù)關(guān)系相關(guān)關(guān)系相同點(diǎn)都是兩個(gè)變量間的關(guān)系不同點(diǎn) 是一種確定關(guān)系是一種非確定關(guān)系是一種因果關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系 合計(jì) 合計(jì) 0.10.050.010.0050.0012.7063.8416.6357.87910.828成對(duì)數(shù)據(jù)的相關(guān)關(guān)系考點(diǎn)分析 考法一 相關(guān)關(guān)系 1.對(duì)變量x,y有觀測(cè)數(shù)據(jù)(xi,yi)(i=1,2,3,…,10),得散點(diǎn)圖1;對(duì)變量u,v有觀測(cè)數(shù)據(jù)(ui,vi)(i=1,2,3,…,10),得散點(diǎn)圖2,由這兩個(gè)散點(diǎn)圖可以斷定( ) A.x與y正相關(guān),u與v正相關(guān) B.x與y正相關(guān),u與v負(fù)相關(guān) C.x與y負(fù)相關(guān),u與v正相關(guān) D.x與y負(fù)相關(guān),u與v負(fù)相關(guān) 【答案】 C 【解析】 由圖1可知,點(diǎn)散布在從左上角到右下角的區(qū)域,各點(diǎn)整體呈遞減趨勢(shì),故x與y負(fù)相關(guān); 由圖2可知,點(diǎn)散布在從左下角到右上角的區(qū)域,各點(diǎn)整體呈遞增趨勢(shì),故u與v正相關(guān).故選:C. 考法一 相關(guān)關(guān)系 2.下列兩變量具有相關(guān)關(guān)系的是( ) A.正方體的體積與邊長(zhǎng) B.人的身高與體重 C.勻速行駛車(chē)輛的行駛距離與時(shí)間 D.球的半徑與體積 【答案】B 【解析】對(duì)選項(xiàng)A,設(shè)正方體的體積,邊長(zhǎng),則,它們之間的關(guān)系是函數(shù)關(guān)系,故A不正確; 對(duì)選項(xiàng)B,人的身高會(huì)影響體重,但不是唯一因素,故B正確. 對(duì)選項(xiàng)C,勻速行駛車(chē)輛的行駛距離與時(shí)間的關(guān)系為,其中為勻速速度,它們之間的關(guān)系是函數(shù)關(guān)系,故C不正確; 對(duì)選項(xiàng)D,設(shè)球的半徑為,則球的體積為,它們之間的關(guān)系是函數(shù)關(guān)系,故D不正確; 故選:B. 考點(diǎn)二 樣本的相關(guān)系數(shù) 3.兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù),,…,下列說(shuō)法錯(cuò)誤的是( ) A.相關(guān)系數(shù)越接近1,變量相關(guān)性越強(qiáng) B.落在回歸直線方程上的樣本點(diǎn)越多,回歸直線方程擬合效果越好 C.相關(guān)指數(shù)越小,殘差平方和越大,即模型的擬合效果越差 D.若表示女大學(xué)生的身高,表示體重則表示女大學(xué)生的身高解釋了的體重變化 【答案】B 【解析】對(duì)于A. 根據(jù)相關(guān)系數(shù)越接近1,變量相關(guān)性越強(qiáng),故正確; 對(duì)于B. 回歸直線方程擬合效果的強(qiáng)弱是由相關(guān)指數(shù)或相關(guān)系數(shù)判定,故不正確; 對(duì)于C. 相關(guān)指數(shù)越小,殘差平方和越大,效果越差,故正確; 對(duì)于D. 根據(jù)的實(shí)際意義可得,表示女大學(xué)生的身高解釋了的體重變化,故正確; 故選:B 考點(diǎn)二 樣本的相關(guān)系數(shù) 4.在線性回歸模型中,分別選擇了甲,乙,丙,丁四個(gè)不同的模型,它們的相關(guān)指數(shù)分別為0.46,0.85,0.72,0.93,其中回歸效果最好的模型是( ) A.甲 B.乙 C.丙 D.丁 【答案】D 【解析】因?yàn)閮蓚€(gè)變量y與x的回歸模型中,它們的相關(guān)指數(shù)越接近于1,這個(gè)模型的擬合效果越好, 而丁的相關(guān)指數(shù)0.93最大,所以回歸效果最好的模型是丁,故選:D 一元線性回歸模型及其應(yīng)用 考點(diǎn)一 樣本中心解小題 5.某產(chǎn)品在某零售攤位上的零售價(jià)(元)與每天的銷(xiāo)售量(個(gè))統(tǒng)計(jì)如下表: 據(jù)上表可得回歸直線方程為,則上表中的的值為( ) A.38 B.39 C.40 D.41 【答案】D 【解析】由題意,, 所以,解得.故選:D. 考點(diǎn)一 樣本中心解小題 6.蟋蟀鳴叫可以說(shuō)是大自然優(yōu)美、和諧的音樂(lè),殊不知蟋蟀鳴叫的頻率(每分鐘鳴叫的次數(shù))與氣溫(單位:)存在著較強(qiáng)的線性相關(guān)關(guān)系.某地觀測(cè)人員根據(jù)下表的觀測(cè)數(shù)據(jù),建立了關(guān)于的線性回歸方程. 則當(dāng)蟋蟀每分鐘鳴叫次時(shí),該地當(dāng)時(shí)的氣溫預(yù)報(bào)值為( ) A. B. C. D. 【答案】D 【解析】由表格中的數(shù)據(jù)可得,, 由于回歸直線過(guò)樣本中心點(diǎn),可得,解得. 所以,回歸直線方程為.在回歸直線方程中,令,可得.故選:D. 考點(diǎn)二 一元線性方程 7.配速是馬拉松運(yùn)動(dòng)中常使用的一個(gè)概念,是速度的一種,是指每公里所需要的時(shí)間,相比配速,把心率控制在一個(gè)合理水平是安全理性跑馬拉松的一個(gè)重要策略.圖1是一個(gè)馬拉松跑者的心率(單位:次/分鐘)和配速(單位:分鐘/公里)的散點(diǎn)圖,圖2是一次馬拉松比賽(全程約42公里)前3000名跑者成績(jī)(單位:分鐘)的頻率分布直方圖. (1)由散點(diǎn)圖看出,可用線性回歸模型擬合與的關(guān)系,求與的線性回歸方程; (2)該跑者如果參加本次比賽,將心率控制在160左右跑完全程,估計(jì)他跑完全程花費(fèi)的時(shí)間,并估計(jì)他能獲得的名次. 參考公式:線性回歸方程中,, 參考數(shù)據(jù):. 【答案】(1);(2)210分鐘,192名. 【解析】(1)由散點(diǎn)圖中數(shù)據(jù)和參考數(shù)據(jù)得,, , , 所以與的線性回歸方程為. (2)將代入回歸方程得, 所以該跑者跑完馬拉松全程所花的時(shí)間為分鐘. 從馬拉松比賽的頻率分布直方圖可知成績(jī)好于210分鐘的累積頻率為 ,有的跑者成績(jī)超過(guò)該跑者, 則該跑者在本次比賽獲得的名次大約是名. 考點(diǎn)二 一元線性方程 8.隨著電商事業(yè)的快速發(fā)展,網(wǎng)絡(luò)購(gòu)物交易額也快速提升,特別是每年的“雙十一”,天貓的交易額數(shù)目驚人.2020年天貓公司的工作人員為了迎接天貓“雙十一”年度購(gòu)物狂歡節(jié),加班加點(diǎn)做了大量準(zhǔn)備活動(dòng),截止2020年11月11日24時(shí),2020年的天貓“雙十一”交易額定格在3700多億元,天貓總公司所有員工對(duì)于新的戰(zhàn)績(jī)皆大歡喜,同時(shí)又對(duì)2021年充滿了憧憬,因此公司工作人員反思從2014年至2020年每年“雙十一”總交易額(取近似值),進(jìn)行分析統(tǒng)計(jì)如下表: (1)通過(guò)分析,發(fā)現(xiàn)可用線性回歸模型擬合總交易額y與年份代碼t的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說(shuō)明; (2)利用最小二乘法建立y關(guān)于t的回歸方程(系數(shù)精確到0.1),預(yù)測(cè)2021年天貓“雙十一”的總交易額. 參考數(shù)據(jù):,,; 參考公式:相關(guān)系數(shù); 回歸方程中,斜率和截距的最小二乘估計(jì)公式分別為:,. 【答案】(1)答案見(jiàn)解析;(2)回歸方程為,預(yù)測(cè)2021年天貓“雙十一”的總交易額約為38百億. 【解析】(1),, , 所以 因?yàn)榭偨灰最~y與年份代碼t的相關(guān)系數(shù)近似為0.98, 說(shuō)明總交易額y與年份代碼t的線性相關(guān)性很強(qiáng), 從而可用線性回歸模型擬合總交易額y與年份代碼t的關(guān)系. (2)因?yàn)?,?所以, , 所以y關(guān)于t的回歸方程為 又將2021年對(duì)應(yīng)的代入回歸方程得:. 所以預(yù)測(cè)2021年天貓“雙十一”的總交易額約為38百億. 考點(diǎn)三 非一元線性方程 9.在一次抽樣調(diào)查中測(cè)得個(gè)樣本點(diǎn),得到下表及散點(diǎn)圖. (1)根據(jù)散點(diǎn)圖判斷與哪一個(gè)適宜作為關(guān)于的回歸方程;(給出判斷即可,不必說(shuō)明理由) (2)根據(jù)(1)的判斷結(jié)果試建立與的回歸方程;(計(jì)算結(jié)果保留整數(shù)) (3)在(2)的條件下,設(shè)且,試求的最小值. 參考公式:回歸方程中,,. 【答案】(1);(2);(3). 【解析】(1)由題中散點(diǎn)圖可以判斷,適宜作為關(guān)于的回歸方程; (2)令,則,原數(shù)據(jù)變?yōu)?由表可知與近似具有線性相關(guān)關(guān)系,計(jì)算得, , , 所以,,則. 所以關(guān)于的回歸方程是. (3)由(2)得,, 任取、,且,即, 可得, 因?yàn)椋瑒t,,所以,, 所以,函數(shù)在區(qū)間上單調(diào)遞增,則. 考點(diǎn)三 非一元線性方程 10.某種新產(chǎn)品投放市場(chǎng)一段時(shí)間后,經(jīng)過(guò)調(diào)研獲得了時(shí)間x(天數(shù))與銷(xiāo)售單價(jià)y(元)的一組數(shù)據(jù),且做了一定的數(shù)據(jù)處理(如表),并作出了散點(diǎn)圖(如圖). 表中. (1)根據(jù)散點(diǎn)圖判斷,與哪一個(gè)更適合作價(jià)格y關(guān)于時(shí)間x的回歸方程類(lèi)型?(不必說(shuō)明理由) (2)根據(jù)判斷結(jié)果和表中數(shù)據(jù),建立y關(guān)于x的回歸方程. (3)若該產(chǎn)品的日銷(xiāo)售量(件)與時(shí)間x的函數(shù)關(guān)系為,求該產(chǎn)品投放市場(chǎng)第幾天的銷(xiāo)售額最高?最高為多少元? 附:對(duì)于一組數(shù)據(jù),其回歸直線的斜率和截距的最小二乘法估計(jì)分別為. 【答案】(1)更適合作價(jià)格y關(guān)于時(shí)間x的回歸方程;(2);(3)第10天,最高銷(xiāo)售額為2420元; 【解析】(1)根據(jù)散點(diǎn)圖知更適合作價(jià)格y關(guān)于時(shí)間x的回歸方程類(lèi)型; (2)令,則, 而, ,即有; (3)由題意結(jié)合(2)知: 日銷(xiāo)售額為, ∴, 若,令, ∴時(shí),,即天,元, 所以該產(chǎn)品投放市場(chǎng)第10天的銷(xiāo)售額最高,最高銷(xiāo)售額為2420元. 分類(lèi)變量與列聯(lián)表 考法一 列聯(lián)表 11.疫苗是為預(yù)防、控制傳染病的發(fā)生、流行,用于人體預(yù)防接種的預(yù)防性生物制品,其前期研發(fā)過(guò)程中,一般都會(huì)進(jìn)行動(dòng)物保護(hù)測(cè)試,為了考察某種疫苗預(yù)防效果,在進(jìn)行動(dòng)物試驗(yàn)時(shí),得到如下統(tǒng)計(jì)數(shù)據(jù): 附表及公式: ,. 現(xiàn)從試驗(yàn)動(dòng)物中任取一只,取得“注射疫苗”的概率為,則下列判斷錯(cuò)誤的是( ) A.注射疫苗發(fā)病的動(dòng)物數(shù)為10 B.從該試驗(yàn)未注射疫苗的動(dòng)物中任取一只,發(fā)病的概率為 C.能在犯錯(cuò)概率不超過(guò)0.001的前提下,認(rèn)為疫苗有效 D.該疫苗的有效率為75% 【答案】(1)D(2)D 【解析】(1)由題意得,,,,,, 所以,,,,,則.故選:D. (2)由題知:注射疫苗動(dòng)物共40只,未注射為60只, 補(bǔ)充列聯(lián)表, 由此可得A、B正確.計(jì)算得:, 故能在犯錯(cuò)概率不超過(guò)0.001的前提下認(rèn)為疫苗有效.C正確,D錯(cuò)誤.故選:D. 考法一 列聯(lián)表 12.現(xiàn)行普通高中學(xué)生在高一時(shí)面臨著選科的問(wèn)題,學(xué)校抽取了部分男?女學(xué)生意愿的一份樣本,制作出如下兩個(gè)等高堆積條形圖: 根據(jù)這兩幅圖中的信息,下列哪個(gè)統(tǒng)計(jì)結(jié)論是不正確的( ) A.樣本中的女生數(shù)量多于男生數(shù)量 B.樣本中有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量 C.樣本中的男生偏愛(ài)兩理一文 D.樣本中的女生偏愛(ài)兩文一理 【答案】D 【解析】由條形圖知女生數(shù)量多于男生數(shù)量,故A正確; 有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量,故B正確; 男生偏愛(ài)兩理一文,故C正確;女生中有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量,故D錯(cuò)誤.故選:D. 考點(diǎn)二 獨(dú)立性檢驗(yàn) 13.為了解使用手機(jī)是否對(duì)學(xué)生的學(xué)習(xí)有影響,某校隨機(jī)抽取名學(xué)生,對(duì)學(xué)習(xí)成績(jī)和使用手機(jī)情況進(jìn)行了調(diào)查,統(tǒng)計(jì)數(shù)據(jù)如表所示(不完整): (1)補(bǔ)充完整所給表格,并根據(jù)表格數(shù)據(jù)計(jì)算是否有的把握認(rèn)為學(xué)生的學(xué)習(xí)成績(jī)與使用手機(jī)有關(guān); (2)現(xiàn)從上表不使用手機(jī)的學(xué)生中按學(xué)習(xí)成績(jī)是否優(yōu)秀分層抽樣選出人,再?gòu)倪@人中隨機(jī)抽取人,記這人中“學(xué)習(xí)成績(jī)優(yōu)秀”的人數(shù)為,試求的分布列與數(shù)學(xué)期望. 參考公式:,其中. 參考數(shù)據(jù): 【答案】(1)沒(méi)有的把握認(rèn)為學(xué)生的學(xué)習(xí)成績(jī)與使用手機(jī)有關(guān);(2)分布列見(jiàn)解析,. 【解析】(1)列聯(lián)表如下表所示: 假設(shè)學(xué)生的學(xué)習(xí)成績(jī)與使用手機(jī)無(wú)關(guān), , 所以,沒(méi)有的把握認(rèn)為學(xué)生的學(xué)習(xí)成績(jī)與使用手機(jī)有關(guān); (2)人中學(xué)習(xí)成績(jī)優(yōu)秀的人有人,學(xué)習(xí)成績(jī)一般的有人, 可能的取值有、、、, ,,,. 所以,隨機(jī)變量的分布列為 . 考點(diǎn)二 獨(dú)立性檢驗(yàn) 14.隨著新冠疫情防控進(jìn)入常態(tài)化,人們的生產(chǎn)生活逐步步入正軌.為拉動(dòng)消費(fèi),某市發(fā)行億元消費(fèi)券.為了解該消費(fèi)券使用人群的年齡結(jié)構(gòu)情況,該市隨機(jī)抽取了人,對(duì)是否使用過(guò)消費(fèi)券的情況進(jìn)行調(diào)查,結(jié)果如下表所示,其中年齡低于歲的人數(shù)占總?cè)藬?shù)的. (1)求、值; (2)若以“年齡歲為分界點(diǎn)”,由以上統(tǒng)計(jì)數(shù)據(jù)完成下面列聯(lián)表,并判斷是否有的把握認(rèn)為是否使用消費(fèi)券與人的年齡有關(guān). 參考數(shù)據(jù): ,其中. 【答案】(1),;(2)列聯(lián)表答案見(jiàn)解析,有的把握認(rèn)為是否使用消費(fèi)券與人的年齡有關(guān). 【解析】(1)由題意得,解得,; (2)由以上統(tǒng)計(jì)數(shù)據(jù)填寫(xiě)下面列聯(lián)表,如下 根據(jù)公式計(jì)算, 所以有的把握認(rèn)為是否使用消費(fèi)券與人的年齡有關(guān). 易混易錯(cuò)練 易錯(cuò)點(diǎn)1 選錯(cuò)回歸模型致錯(cuò) 1.在一次抽樣調(diào)查中測(cè)得5組成對(duì)數(shù)據(jù),其數(shù)值及散點(diǎn)圖如下: (1)根據(jù)散點(diǎn)圖判斷y=a+bx與y=c+k·x-1哪一個(gè)更適宜作為y關(guān)于x的經(jīng)驗(yàn)回歸方程類(lèi)型;(給出判斷即可,不必說(shuō)明理由) (2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),試建立y與x的經(jīng)驗(yàn)回歸方程;(計(jì)算結(jié)果保留整數(shù)) (3)在(2)的條件下,設(shè)z=y+x且x∈[4,+∞),試求z的最小值. 參考公式:經(jīng)驗(yàn)回歸方程y^=b^x+a^中, b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nx y∑i=1nxi2-nx?2,a^=y-b^x. 1.解析 (1)由題中散點(diǎn)圖可以判斷,y=c+k·x-1更適宜作為y關(guān)于x的經(jīng)驗(yàn)回歸方程類(lèi)型. (2)令t=x-1,則y=c+kt,構(gòu)造新的成對(duì)數(shù)據(jù),如下表: 易知y與t存在線性相關(guān)關(guān)系. 計(jì)算得t=1.55,y=7.2,k^≈4,c^=y-k^ t=1,所以y關(guān)于t的經(jīng)驗(yàn)回歸方程為y^=4t+1, 所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為y^=4x+1. (3)由(2)得z=y+x=4x+x+1,易得z=4x+x+1在x∈[4,+∞)上是單調(diào)遞增函數(shù),即最小值為6. 易錯(cuò)點(diǎn)2 求χ2用錯(cuò)公式致錯(cuò) 2.為了解人們對(duì)延遲退休年齡政策的態(tài)度,某部門(mén)從年齡在15歲到65歲的人群中隨機(jī)調(diào)查了100人,并得到如圖所示的頻率分布直方圖,在這100人中不支持延遲退休年齡政策的人數(shù)與年齡的統(tǒng)計(jì)結(jié)果如下表所示. (1)由頻率分布直方圖,估計(jì)這100人年齡的平均數(shù)(同一組數(shù)據(jù)用該區(qū)間的中點(diǎn)值代表); (2)根據(jù)以上統(tǒng)計(jì)數(shù)據(jù)填寫(xiě)下面的2×2列聯(lián)表,并依據(jù)α=0.05的獨(dú)立性檢驗(yàn),分析以45歲為分界點(diǎn)的不同人群對(duì)延遲退休年齡政策的態(tài)度是否存在差異. 單位:人 附表及公式: χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d. 2.解析 (1)估計(jì)這100人年齡的平均數(shù)為20×0.2+30×0.1+40×0.2+50×0.3+60×0.2=42(歲). (2)由題中頻率分布直方圖可知,45歲以下的有50人,45歲及以上的有50人. 可得2×2列聯(lián)表如下: 單位:人 零假設(shè)為H0:不同人群與態(tài)度相互獨(dú)立,即以45歲為分界點(diǎn)的不同人群對(duì)延遲退休年齡政策的態(tài)度不存在差異.計(jì)算可得χ2=100×(35×10?40×15)275×25×50×50≈1.3333.841=x0.05. 依據(jù)α=0.05的獨(dú)立性檢驗(yàn),推斷H0不成立,即認(rèn)為確診患新冠肺炎與年齡有關(guān). 4.某地區(qū)在“精準(zhǔn)扶貧”工作中切實(shí)貫徹習(xí)近平總書(shū)記提出的“因地制宜”的指導(dǎo)思想,扶貧工作小組經(jīng)過(guò)多方調(diào)研,綜合該地區(qū)的氣候、地質(zhì)、地理位置等特點(diǎn),決定向當(dāng)?shù)剞r(nóng)戶推行某類(lèi)景觀樹(shù)苗種植.工作小組根據(jù)市場(chǎng)前景重點(diǎn)考察了A,B兩種景觀樹(shù)苗,為對(duì)比兩種樹(shù)苗的成活率,工作小組進(jìn)行了引種試驗(yàn),分別引種樹(shù)苗A,B各50株,試驗(yàn)發(fā)現(xiàn)有80%的樹(shù)苗成活,未成活的樹(shù)苗A,B株數(shù)之比為1∶3. (1)完成下面的2×2列聯(lián)表,依據(jù)α=0.01的獨(dú)立性檢驗(yàn),分析樹(shù)苗A,B的成活率是否有差異; (2)已知樹(shù)苗A引種成活后再經(jīng)過(guò)1年的生長(zhǎng)即可作為景觀樹(shù)A在市場(chǎng)上出售,但每株售價(jià)y(單位:百元)受其樹(shù)干的直徑x(單位:cm)影響,扶貧工作小組對(duì)一批已出售的景觀樹(shù)A的相關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),得到結(jié)果如下表: 根據(jù)上述數(shù)據(jù),判斷是否可以用線性回歸模型擬合y與x的關(guān)系,并用樣本相關(guān)系數(shù)r加以說(shuō)明.(一般認(rèn)為|r|>0.75為高度線性相關(guān)) 參考公式及數(shù)據(jù):樣本相關(guān)系數(shù)r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,∑i=15(xi-x)2=250, ∑i=15(yi-y)2=320. χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d. 附表: 4.解析 試驗(yàn)發(fā)現(xiàn)有80%的樹(shù)苗成活,故未成活的樹(shù)苗有20株,未成活的樹(shù)苗A,B株數(shù)之比為1∶3,所以樹(shù)苗A未成活5株,成活45株,樹(shù)苗B未成活15株,成活35株. (1)補(bǔ)充列聯(lián)表如下: 零假設(shè)為H0:樹(shù)苗A,B的成活率無(wú)差異.計(jì)算可得χ2=100×(45×15-35×5)280×20×50×50=6.250.75.故可以用線性回歸模型擬合y與x的關(guān)系. 一、數(shù)形結(jié)合思想在統(tǒng)計(jì)中的應(yīng)用 1.下圖是某地區(qū)2010年至2019年污染天數(shù)y與年份x的折線圖,根據(jù)2010年至2014年的數(shù)據(jù),2015年至2019年的數(shù)據(jù),2010年至2019年的數(shù)據(jù)分別建立一元線性回歸模型y^=b1x+a1,y^=b2x+a2,y^=b3x+a3,則( ) A.b1
微信掃碼,快速注冊(cè)
注冊(cè)成功