
第三講 成對數(shù)據(jù)的統(tǒng)計(jì)分析
知識(shí)梳理 · 雙基自測
知識(shí)點(diǎn)一 變量的相關(guān)關(guān)系(1)相關(guān)關(guān)系兩個(gè)變量有關(guān)系,但又沒有確切到可由其中的一個(gè)_______________另一個(gè)的程度,這種關(guān)系稱為相關(guān)關(guān)系.(2)散點(diǎn)圖每一個(gè)序號(hào)下的成對樣本數(shù)據(jù)都可用直角坐標(biāo)系中的_____表示出來,由這些點(diǎn)組成的統(tǒng)計(jì)圖稱為散點(diǎn)圖.
(3)正相關(guān)、負(fù)相關(guān)如果從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)_______的趨勢,我們就稱這兩個(gè)變量正相關(guān);如果當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)_______的趨勢,則稱這兩個(gè)變量負(fù)相關(guān).(4)變量的線性相關(guān)如果兩個(gè)變量的取值呈現(xiàn)_________________,而且散點(diǎn)落在___________附近,我們就稱這兩個(gè)變量線性相關(guān).一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個(gè)變量_______________________.
知識(shí)點(diǎn)三 獨(dú)立性檢驗(yàn)(1)分類變量:用以區(qū)別不同的現(xiàn)象或性質(zhì)的隨機(jī)變量.(2)2×2列聯(lián)表設(shè)X,Y為兩個(gè)分類變量,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(2×2列聯(lián)表)如下:
(3)獨(dú)立性檢驗(yàn)①零假設(shè)(或原假設(shè))以Ω為樣本空間的古典概型.設(shè)X和Y為定義在Ω上,取值于{0,1}的成對分類變量.H0:_______________________________________稱為零假設(shè).
P(Y=1|X=0)=P(Y=1|X=1)
②臨界值2=_________________________.對于任何小概率值α,可以找到相應(yīng)的正實(shí)數(shù)xα,使得下面關(guān)系成立:P( 2≥xα)=α.稱xα為α的_________,這個(gè)臨界值就可作為判斷 2大小的標(biāo)準(zhǔn).概率值α越小,臨界值xα越大.
③獨(dú)立性檢驗(yàn)基于小概率值α的檢驗(yàn)規(guī)則是:當(dāng)2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y_________,該推斷犯錯(cuò)誤的概率不_________;當(dāng)20 D.|r1|>|r2|
[解析] (1)由于點(diǎn)越靠近回歸直線,則相關(guān)性越強(qiáng),相關(guān)系數(shù)越大,又由于點(diǎn)E到回歸直線的距離最大,所以要去掉點(diǎn)E.(2)由散點(diǎn)圖可知,線性相關(guān)系數(shù)r1的圖象表示y與x成負(fù)相關(guān),故-10,故B錯(cuò)誤;∵線性相關(guān)系數(shù)r2的點(diǎn)較線性相關(guān)系數(shù)r1的點(diǎn)密集,故|r2|>|r1|,故r1+r2>0,故C正確,D錯(cuò)誤.故選AC.
(1)(2022·江西南昌模擬)某工廠研究某種產(chǎn)品的產(chǎn)量x(單位:噸)與某種原材料的用量y(單位:噸)之間的相關(guān)關(guān)系,在生產(chǎn)過程中收集了4組數(shù)據(jù)如表所示:
(2)(2023·河南安陽開學(xué)考)2022年6月某一周,“東方甄選”直播間的交易額共計(jì)3.5億元,數(shù)據(jù)統(tǒng)計(jì)如下表:①通過分析,發(fā)現(xiàn)可用線性回歸模型擬合交易額y與t的關(guān)系,請用相關(guān)系數(shù)(系數(shù)精確到0.01)加以說明;②利用最小二乘法建立y關(guān)于t的經(jīng)驗(yàn)回歸方程(系數(shù)精確到0.1),并預(yù)測下一周的第一天(即第8天)的交易額.
因?yàn)榻灰最~y與t的相關(guān)系數(shù)近似為0.98,說明交易額y與t具有很強(qiáng)的正線性相關(guān)關(guān)系,從而可用線性回歸模型擬合交易額y與t的關(guān)系.
〔變式訓(xùn)練1〕(2021·安徽六校教育研究會(huì)素質(zhì)測試)某商場近5個(gè)月的銷售額和利潤額如表所示:(1)畫出散點(diǎn)圖,觀察散點(diǎn)圖,說明兩個(gè)變量有怎樣的相關(guān)關(guān)系?(2)求出利潤額y關(guān)于銷售額x的經(jīng)驗(yàn)回歸直線方程;
[解析] (1)散點(diǎn)圖如圖所示:兩個(gè)變量正相關(guān),且具有線性相關(guān)關(guān)系.
(2021·河南駐馬店期末)近年來,共享單車進(jìn)駐城市,綠色出行引領(lǐng)時(shí)尚.某公司計(jì)劃對未開通共享單車的A縣城進(jìn)行車輛投放,為了確定車輛投放量,對過去在其他縣城的投放量情況以及年使用人次進(jìn)行了統(tǒng)計(jì),得到了投放量x(單位:千輛)與年使用人次y(單位:千次)的數(shù)據(jù)如下表所示,根據(jù)數(shù)據(jù)繪制投放量x與年使用人次y的散點(diǎn)圖如圖所示.
(1)觀察散點(diǎn)圖,可知兩個(gè)變量不具有線性相關(guān)關(guān)系,擬用對數(shù)函數(shù)模型y=a+blg x或指數(shù)函數(shù)模型y=c·dx(c>0,d>0)對兩個(gè)變量的關(guān)系進(jìn)行擬合,請問哪個(gè)模型更適宜作為投放量x與年使用人次y的經(jīng)驗(yàn)回歸方程類型(給出判斷即可,不必說明理由),并求出y關(guān)于x的經(jīng)驗(yàn)回歸方程;
(2)已知每輛單車的購入成本為200元,年調(diào)度費(fèi)以及維修等的使用成本為每人次0.2元,按用戶每使用一次,收費(fèi)1元計(jì)算,若投入8 000輛單車,則幾年后可實(shí)現(xiàn)盈利?參考數(shù)據(jù):
(2)投入8千輛單車,則年使用人次為3.47×100.25×8=347千人次,每年的收益為347×(1-0.2)=277.6(千元),總投資8 000×200=1 600 000=1 600千元,假設(shè)需要n年開始盈利,則n×277.6>1 600,即n>5.76,故需要6年才能開始盈利.
非線性相關(guān)問題一般通過換元法轉(zhuǎn)化為線性相關(guān)(線性回歸分析)問題解決.
(1)(2021·全國高考)甲、乙兩臺(tái)機(jī)床生產(chǎn)同種產(chǎn)品,產(chǎn)品按質(zhì)量分為一級(jí)品和二級(jí)品,為了比較兩臺(tái)機(jī)床產(chǎn)品的質(zhì)量,分別用兩臺(tái)機(jī)床各生產(chǎn)了200件產(chǎn)品,產(chǎn)品的質(zhì)量情況統(tǒng)計(jì)如下表:
(2)(2022·四川大學(xué)附中期中)2020年,全球爆發(fā)了新冠肺炎疫情,為了預(yù)防疫情蔓延,某校推遲2020年的春季線下開學(xué),并采取了“停課不停學(xué)”的線上授課措施.為了解學(xué)生對線上課程的滿意程度,隨機(jī)抽取了該校的100名學(xué)生(男生與女生的人數(shù)之比為32)對線上課程進(jìn)行評價(jià)打分,若評分不低于80分視為滿意,其得分情況的頻率分布直方圖如圖所示,若根據(jù)頻率分布直方圖得到的評分不低于70分的頻率為0.85.
①估計(jì)100名學(xué)生對線上課程評分的平均值;(每組數(shù)據(jù)用該組的區(qū)間中點(diǎn)值為代表)②結(jié)合頻率分布直方圖,請完成以下2×2列聯(lián)表,并回答能否有99%的把握認(rèn)為對“線上教學(xué)是否滿意與性別有關(guān)”;
(2)①由已知得(0.015+b+0.03)×10=0.85,解得b=0.04,又(0.005+a)×10=1-0.85,解得a=0.01,評分的平均值為55×0.05+65×0.1+75×0.3+85×0.4+95×0.15=80.
解獨(dú)立性檢驗(yàn)的應(yīng)用問題的關(guān)注點(diǎn)(1)兩個(gè)明確:①明確兩類主體.②明確研究的兩個(gè)問題.(2)兩個(gè)關(guān)鍵:①準(zhǔn)確列出2×2列聯(lián)表.②準(zhǔn)確理解2.
注意:查表時(shí)不是查最大允許值,而是先根據(jù)題目要求的百分比找到第一行對應(yīng)的數(shù)值,再將該數(shù)值對應(yīng)的xα值與求得的 2相比較.另外,表中第一行數(shù)據(jù)表示兩個(gè)變量沒有關(guān)聯(lián)的可能性p,所以其有關(guān)聯(lián)的可能性為1-p.
A.25 B.45 C.60 D.40
(2)(2023·廣西欽州、崇左質(zhì)檢)某出租汽車公司決定更換一批新的小汽車以代替原來的報(bào)廢的出租車,現(xiàn)有A,B兩款車型,根據(jù)以往這兩種出租車車型的數(shù)據(jù),得到兩款出租車型使用壽命頻數(shù)表如下:
①填寫下表,并判斷是否有99%的把握認(rèn)為出租車的使用壽命年數(shù)與汽車車型有關(guān)?
[解析] (1)由題意被調(diào)查的男女生人數(shù)相同,設(shè)男生的人數(shù)為:5n(n∈N*),由題意可列出2×2列聯(lián)表:
(2)①根據(jù)題目所給數(shù)據(jù)得到如下2×2的列聯(lián)表:
名師講壇 · 素養(yǎng)提升
(1)分別估計(jì)該市一天的空氣質(zhì)量等級(jí)為1,2,3,4的概率;(2)求一天中到該公園鍛煉的平均人次的估計(jì)值(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值為代表);(3)若某天的空氣質(zhì)量等級(jí)為1或2,則稱這天“空氣質(zhì)量好”;若某天的空氣質(zhì)量等級(jí)為3或4,則稱這天“空氣質(zhì)量不好”.根據(jù)所給數(shù)據(jù),完成下面的2×2列聯(lián)表,并根據(jù)列聯(lián)表,判斷是否有95%的把握認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān)?
[解析] (1)由所給數(shù)據(jù),該市一天的空氣質(zhì)量等級(jí)為1,2,3,4的概率的估計(jì)值如下表:
這是一份高考數(shù)學(xué)一輪總復(fù)習(xí)課件第8章統(tǒng)計(jì)與統(tǒng)計(jì)分析第3講成對數(shù)據(jù)的統(tǒng)計(jì)分析(含解析),共60頁。PPT課件主要包含了回歸分析,獨(dú)立性檢驗(yàn),12×2列聯(lián)表,2獨(dú)立性檢驗(yàn),名師點(diǎn)睛,題組一,走出誤區(qū),答案1√,2√3×,題組二等內(nèi)容,歡迎下載使用。
這是一份2024屆高考數(shù)學(xué)一輪總復(fù)習(xí)第八章統(tǒng)計(jì)與統(tǒng)計(jì)分析第三講成對數(shù)據(jù)的統(tǒng)計(jì)分析課件,共59頁。PPT課件主要包含了回歸分析,獨(dú)立性檢驗(yàn),12×2列聯(lián)表,2獨(dú)立性檢驗(yàn),名師點(diǎn)睛,A①②,B①④,C③④,D②③,答案C等內(nèi)容,歡迎下載使用。
這是一份適用于新教材2024版高考數(shù)學(xué)一輪總復(fù)習(xí)第十章統(tǒng)計(jì)與成對數(shù)據(jù)的統(tǒng)計(jì)分析第三節(jié)成對數(shù)據(jù)的統(tǒng)計(jì)分析課件北師大版,共40頁。PPT課件主要包含了內(nèi)容索引,強(qiáng)基礎(chǔ)固本增分,研考點(diǎn)精準(zhǔn)突破,答案86,參考數(shù)據(jù)等內(nèi)容,歡迎下載使用。
新教材適用2024版高考數(shù)學(xué)一輪總復(fù)習(xí)第9章統(tǒng)計(jì)成對數(shù)據(jù)的統(tǒng)計(jì)分析第2講用樣本估計(jì)總體課件
新教材適用2024版高考數(shù)學(xué)一輪總復(fù)習(xí)第9章統(tǒng)計(jì)成對數(shù)據(jù)的統(tǒng)計(jì)分析第1講隨機(jī)抽樣課件
高考數(shù)學(xué)一輪復(fù)習(xí)第9章第3節(jié)成對數(shù)據(jù)的統(tǒng)計(jì)分析課件
人教A版高考數(shù)學(xué)一輪總復(fù)習(xí)第9章第3節(jié)成對數(shù)據(jù)的統(tǒng)計(jì)分析教學(xué)課件
微信掃碼,快速注冊
注冊成功