



2020屆高考數(shù)學(xué)一輪復(fù)習(xí)新課改省份專用學(xué)案:第九章第二節(jié)變量的相關(guān)性與統(tǒng)計(jì)案例
展開第二節(jié) 變量的相關(guān)性與統(tǒng)計(jì)案例突破點(diǎn)一 回歸分析 1.變量間的相關(guān)關(guān)系(1)常見的兩變量之間的關(guān)系有兩類:一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系;與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.(2)從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系稱為正相關(guān),點(diǎn)散布在左上角到右下角的區(qū)域內(nèi),兩個(gè)變量的相關(guān)關(guān)系為負(fù)相關(guān).2.兩個(gè)變量的線性相關(guān)回歸直線從散點(diǎn)圖上看,如果這些點(diǎn)從整體上看大致分布在通過散點(diǎn)圖中心的一條直線附近,稱兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線回歸方程回歸方程為=x+,其中=, =-最小二乘法通過求的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離的平方和最小,這一方法叫做最小二乘法相關(guān)系數(shù)當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān).r的絕對(duì)值越接近于1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng);r的絕對(duì)值越接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.通常|r|大于0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)性 一、判斷題(對(duì)的打“√”,錯(cuò)的打“×”)(1)相關(guān)關(guān)系與函數(shù)關(guān)系都是一種確定性的關(guān)系,也是一種因果關(guān)系.( )(2)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成正相關(guān)關(guān)系.( )(3)只有兩個(gè)變量有相關(guān)關(guān)系,所得到的回歸模型才有預(yù)測(cè)價(jià)值.( )答案:(1)× (2)√ (3)√二、填空題1.已知x,y的取值如下表,從散點(diǎn)圖可以看出y與x具有線性相關(guān)關(guān)系,且回歸方程為=0.95x+,則=________.x0134y2.24.34.86.7答案:2.62.兩個(gè)變量y與x的回歸模型中,分別選擇了4個(gè)不同模型,經(jīng)計(jì)算得到它們的相關(guān)系數(shù)r的值如下表,其中擬合效果最好的模型是________.模型模型1模型2模型3模型4r0.980.800.500.25答案:模型13.已知變量x,y之間具有線性相關(guān)關(guān)系,其回歸方程為=-3+x,若i=17, i=4,則的值為________.答案:2 考法一 相關(guān)關(guān)系的判斷 [例1] (1)(2019·福建泉州月考)在下列各圖中,兩個(gè)變量具有相關(guān)關(guān)系的圖是( )A.①② B.①③C.②③ D.②④(2)(2019·昆明一中一模)若對(duì)于變量x的取值為3,4,5,6,7時(shí),變量y對(duì)應(yīng)的值依次分別為4.0,2.5,-0.5,-1,-2;若對(duì)于變量u的取值為1,2,3,4時(shí),變量v對(duì)應(yīng)的值依次分別為2,3,4,6,則變量x和y,變量u和v的相關(guān)關(guān)系是( )A.變量x和y是正相關(guān),變量u和v是正相關(guān)B.變量x和y是正相關(guān),變量u和v是負(fù)相關(guān)C.變量x和y是負(fù)相關(guān),變量u和v是負(fù)相關(guān)D.變量x和y是負(fù)相關(guān),變量u和v是正相關(guān)[解析] (1)①為函數(shù)關(guān)系;②為正相關(guān)關(guān)系;③為負(fù)相關(guān)關(guān)系;④沒有明顯相關(guān)性.(2)變量x增加,變量y減少,所以變量x和y是負(fù)相關(guān);變量u增加,變量v增加,所以變量u和v是正相關(guān),故選D.[答案] (1)C (2)D[方法技巧]判斷相關(guān)關(guān)系的2種方法(1)散點(diǎn)圖法:如果所有的樣本點(diǎn)都落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系.如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系.(2)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判定,|r|越趨近于1相關(guān)性越強(qiáng). 考法二 線性回歸分析 [例2] (2018·全國(guó)卷Ⅱ)下圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額y(單位:億元)的折線圖.為了預(yù)測(cè)該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額,建立了y與時(shí)間變量t的兩個(gè)線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時(shí)間變量t的值依次為1,2,…,17)建立模型①:=-30.4+13.5t;根據(jù)2010年至2016年的數(shù)據(jù)(時(shí)間變量t的值依次為1,2,…,7)建立模型②:=99+17.5t.(1)分別利用這兩個(gè)模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值;(2)你認(rèn)為用哪個(gè)模型得到的預(yù)測(cè)值更可靠?并說(shuō)明理由.[解] (1)利用模型①,可得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為=-30.4+13.5×19=226.1(億元).利用模型②,可得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為=99+17.5×9=256.5(億元).(2)利用模型②得到的預(yù)測(cè)值更可靠.理由如下:(ⅰ)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)沒有隨機(jī)散布在直線y=-30.4+13.5t上下,這說(shuō)明利用2000年至2016年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì).2010年相對(duì)2009年的環(huán)境基礎(chǔ)設(shè)施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)位于一條直線的附近,這說(shuō)明從2010年開始環(huán)境基礎(chǔ)設(shè)施投資額的變化規(guī)律呈線性增長(zhǎng)趨勢(shì),利用2010年至2016年的數(shù)據(jù)建立的線性模型=99+17.5t可以較好地描述2010年以后的環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì),因此利用模型②得到的預(yù)測(cè)值更可靠.(ⅱ)從計(jì)算結(jié)果看,相對(duì)于2016年的環(huán)境基礎(chǔ)設(shè)施投資額220億元,由模型①得到的預(yù)測(cè)值226.1億元的增幅明顯偏低,而利用模型②得到的預(yù)測(cè)值的增幅比較合理,說(shuō)明利用模型②得到的預(yù)測(cè)值更可靠.(以上給出了2種理由,考生答出其中任意一種或其他合理理由均可得分)[方法技巧]1.回歸直線方程中系數(shù)的2種求法(1)公式法:利用公式,求出回歸系數(shù),.(2)待定系數(shù)法:利用回歸直線過樣本點(diǎn)中心(,)求系數(shù).2.回歸分析的2種策略(1)利用回歸方程進(jìn)行預(yù)測(cè):把回歸直線方程看作一次函數(shù),求函數(shù)值.(2)利用回歸直線判斷正、負(fù)相關(guān):決定正相關(guān)還是負(fù)相關(guān)的是回歸系數(shù). 1.四名同學(xué)根據(jù)各自的樣本數(shù)據(jù)研究變量x,y之間的相關(guān)關(guān)系,并求得回歸直線方程,分別得到以下四個(gè)結(jié)論:①y與x負(fù)相關(guān)且=2.347x-6.423;②y與x負(fù)相關(guān)且=-3.476x+5.648;③y與x正相關(guān)且=5.437x+8.493;④y與x正相關(guān)且=-4.326x-4.578.其中一定不正確的結(jié)論的序號(hào)是( )A.①② B.②③C.③④ D.①④解析:選D 正相關(guān)指的是y隨x的增大而增大,負(fù)相關(guān)指的是y隨x的增大而減小,故不正確的為①④.2.二手車經(jīng)銷商小王對(duì)其所經(jīng)營(yíng)的A型號(hào)二手汽車的使用年數(shù)x與銷售價(jià)格y(單位:萬(wàn)元/輛)進(jìn)行整理,得到如下數(shù)據(jù):使用年數(shù)x234567售價(jià)y201286.44.43z=ln y3.002.482.081.861.481.10z關(guān)于x的折線圖,如圖所示:(1)由折線圖可以看出,可以用線性回歸模型擬合z與x的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說(shuō)明;(2)求y關(guān)于x的回歸方程,并預(yù)測(cè)某輛A型號(hào)二手車當(dāng)使用年數(shù)為9年時(shí)售價(jià)約為多少.(,小數(shù)點(diǎn)后保留兩位有效數(shù)字)參考公式:==,=-,r= .參考數(shù)據(jù):iyi=187.4,izi=47.64,=139,=4.18, =13.96,=1.53,ln 1.46≈0.38.解:(1)由題意,知=×(2+3+4+5+6+7)=4.5,=×(3+2.48+2.08+1.86+1.48+1.10)=2,又izi=47.64,=4.18,=1.53,∴r==-≈-0.99,∴z與x的相關(guān)系數(shù)大約為-0.99,說(shuō)明z與x的線性相關(guān)程度很高.(2)==-≈-0.36,∴=-=2+0.36×4.5=3.62,∴z與x的線性回歸方程是=-0.36x+3.62,又z=ln y,∴y關(guān)于x的回歸方程是=e-0.36x+3.62.令x=9,得=e-0.36×9+3.62=e0.38,∵ln 1.46≈0.38,∴=1.46,即預(yù)測(cè)某輛A型號(hào)二手車當(dāng)使用年數(shù)為9年時(shí)售價(jià)約為1.46萬(wàn)元.突破點(diǎn)二 獨(dú)立性檢驗(yàn)1.分類變量變量的不同“值”表示個(gè)體所屬的不同類別,像這類變量稱為分類變量.2.列聯(lián)表列出兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為 y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+dK2=(其中n=a+b+c+d為樣本容量),可利用獨(dú)立性檢驗(yàn)判斷表來(lái)判斷“X與Y的關(guān)系”.一、判斷題(對(duì)的打“√”,錯(cuò)的打“×”)(1)事件X,Y關(guān)系越密切,則由觀測(cè)數(shù)據(jù)計(jì)算得到的K2的值越大.( )(2)由獨(dú)立性檢驗(yàn)可知,有99%的把握認(rèn)為物理成績(jī)優(yōu)秀與數(shù)學(xué)成績(jī)有關(guān),某人數(shù)學(xué)成績(jī)優(yōu)秀,則他有99%的可能物理優(yōu)秀.( )答案:(1)√ (2)×二、填空題1.下面是2×2列聯(lián)表: y1y2總計(jì)x1a2173x2222547總計(jì)b46120則表中a,b的值分別為________.解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.答案:52,74 2.為了判斷高中三年級(jí)學(xué)生是否選修文科與性別的關(guān)系,現(xiàn)隨機(jī)抽取50名學(xué)生,得到如下2×2列聯(lián)表: 理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根據(jù)表中數(shù)據(jù),得到K2的觀測(cè)值k=≈4.844.則認(rèn)為選修文科與性別有關(guān)系出錯(cuò)的可能性為________.答案:5%3.(2019·阜陽(yáng)質(zhì)檢)某班主任對(duì)全班30名男生進(jìn)行了作業(yè)量多少的調(diào)查,數(shù)據(jù)如下表: 認(rèn)為作業(yè)多認(rèn)為作業(yè)不多總計(jì)喜歡玩電腦游戲12820不喜歡玩電腦游戲2810總計(jì)141630該班主任據(jù)此推斷男生認(rèn)為作業(yè)多與喜歡玩電腦游戲有關(guān)系,則這種推斷犯錯(cuò)誤的概率不超過________.答案:0.05 [典例] (2018·全國(guó)卷Ⅲ)某工廠為提高生產(chǎn)效率,開展技術(shù)創(chuàng)新活動(dòng),提出了完成某項(xiàng)生產(chǎn)任務(wù)的兩種新的生產(chǎn)方式.為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機(jī)分成兩組,每組20人.第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務(wù)的工作時(shí)間(單位:min)繪制了如下莖葉圖:(1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說(shuō)明理由.(2)求40名工人完成生產(chǎn)任務(wù)所需時(shí)間的中位數(shù)m,并將完成生產(chǎn)任務(wù)所需時(shí)間超過m和不超過m的工人數(shù)填入下面的列聯(lián)表: 超過m不超過m第一種生產(chǎn)方式 第二種生產(chǎn)方式 (3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認(rèn)為兩種生產(chǎn)方式的效率有差異?附:K2=,[解] (1)第二種生產(chǎn)方式的效率更高.理由如下:(ⅰ)由莖葉圖可知:用第一種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時(shí)間至少80 min,用第二種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時(shí)間至多79 min.因此第二種生產(chǎn)方式的效率更高.(ⅱ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時(shí)間的中位數(shù)為85.5 min,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時(shí)間的中位數(shù)為73.5 min.因此第二種生產(chǎn)方式的效率更高.(ⅲ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需平均時(shí)間高于80 min;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需平均時(shí)間低于80 min.因此第二種生產(chǎn)方式的效率更高.(ⅳ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時(shí)間分布在莖8上的最多,關(guān)于莖8大致呈對(duì)稱分布;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時(shí)間分布在莖7上的最多,關(guān)于莖7大致呈對(duì)稱分布.又用兩種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時(shí)間分布的區(qū)間相同,故可以認(rèn)為用第二種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時(shí)間比用第一種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時(shí)間更少.因此第二種生產(chǎn)方式的效率更高.(以上給出了4種理由,答出其中任意一種或其他合理理由均可得分)(2)由莖葉圖知m==80.列聯(lián)表如下: 超過m不超過m第一種生產(chǎn)方式155第二種生產(chǎn)方式515(3)因?yàn)?/span>K2==10>6.635,所以有99%的把握認(rèn)為兩種生產(chǎn)方式的效率有差異.[方法技巧](1)獨(dú)立性檢驗(yàn)的關(guān)鍵是正確列出2×2列聯(lián)表,并計(jì)算出K2的值.(2)獨(dú)立性檢驗(yàn)是對(duì)兩個(gè)變量有關(guān)系的可信程度的判斷,而不是對(duì)它們是否有關(guān)系的判斷.[針對(duì)訓(xùn)練]1.(2019·安徽黃山一模)在吸煙與患肺癌這兩個(gè)分類變量的獨(dú)立性檢驗(yàn)的計(jì)算中,下列說(shuō)法正確的是( )A.若K2的觀測(cè)值為k=6.635,在犯錯(cuò)誤的概率不超過0.01的前提下認(rèn)為吸煙與患肺癌有關(guān)系,那么在100個(gè)吸煙的人中必有99人患有肺癌B.由獨(dú)立性檢驗(yàn)可知,在犯錯(cuò)誤的概率不超過0.01的前提下認(rèn)為吸煙與患肺癌有關(guān)系時(shí),我們說(shuō)某人吸煙,那么他有99%的可能患有肺癌C.若從統(tǒng)計(jì)量中求出在犯錯(cuò)誤的概率不超過0.01的前提下認(rèn)為吸煙與患肺癌有關(guān)系,是指有1%的可能性使得判斷出現(xiàn)錯(cuò)誤D.以上三種說(shuō)法都不正確解析:選C 獨(dú)立性檢驗(yàn)得出的結(jié)論是帶有概率性質(zhì)的,只能說(shuō)結(jié)論成立的概率有多大,而不能完全肯定一個(gè)結(jié)論,因此才出現(xiàn)了臨界值表,在分析問題時(shí)一定要注意這點(diǎn),不可對(duì)某個(gè)問題下確定性結(jié)論,否則就可能對(duì)統(tǒng)計(jì)計(jì)算的結(jié)果作出錯(cuò)誤的解釋.若從統(tǒng)計(jì)量中求出在犯錯(cuò)誤的概率不超過0.01的前提下認(rèn)為吸煙與患肺癌有關(guān)系,是指有1%的可能性使得判斷出現(xiàn)錯(cuò)誤.故選C.2.(2019·池州模擬)某職稱晉級(jí)評(píng)定機(jī)構(gòu)對(duì)參加某次專業(yè)技術(shù)考試的100人的成績(jī)進(jìn)行了統(tǒng)計(jì),繪制的頻率分布直方圖如圖所示.規(guī)定80分以上者晉級(jí)成功,否則晉級(jí)失敗(滿分為100分).(1)求圖中a的值;(2)估計(jì)該次考試的平均分(同一組中的數(shù)據(jù)用該組的區(qū)間中點(diǎn)值代表);(3)根據(jù)已知條件完成下面2×2列聯(lián)表,并判斷能否有85%的把握認(rèn)為“晉級(jí)成功”與性別有關(guān). 晉級(jí)成功晉級(jí)失敗總計(jì)男16 女 50總計(jì) P(K2≥k)0.400.250.150.100.050.025k0.7081.3232.0722.7063.8415.024解:(1)由頻率分布直方圖中各小長(zhǎng)方形面積總和為1,得(2a+0.020+0.030+0.040)×10=1,解得a=0.005.(2)由頻率分布直方圖知各小組的中點(diǎn)值依次是55,65,75,85,95,對(duì)應(yīng)的頻率分別為0.05,0.30,0.40,0.20,0.05,則估計(jì)該次考試的平均分為=55×0.05+65×0.3+75×0.4+85×0.2+95×0.05=74(分).(3)由頻率分布直方圖知,晉級(jí)成功的頻率為0.2+0.05=0.25,故晉級(jí)成功的人數(shù)為100×0.25=25,填寫2×2列聯(lián)表如下: 晉級(jí)成功晉級(jí)失敗總計(jì)男163450女94150總計(jì)2575100K2=≈2.613>2.072,所以有85%的把握認(rèn)為“晉級(jí)成功”與性別有關(guān).

- 1.電子資料成功下載后不支持退換,如發(fā)現(xiàn)資料有內(nèi)容錯(cuò)誤問題請(qǐng)聯(lián)系客服,如若屬實(shí),我們會(huì)補(bǔ)償您的損失
- 2.壓縮包下載后請(qǐng)先用軟件解壓,再使用對(duì)應(yīng)軟件打開;軟件版本較低時(shí)請(qǐng)及時(shí)更新
- 3.資料下載成功后可在60天以內(nèi)免費(fèi)重復(fù)下載