
(1)相關(guān)關(guān)系:當(dāng)自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系.與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.
(2)散點圖:表示具有相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的圖形叫做散點圖,它可直觀地判斷兩變量的關(guān)系是否可以用線性關(guān)系表示.若這些散點有 y 隨 x 增大而增大的趨勢,則稱兩個變量正相關(guān);若這些散點有 y 隨 x 增大而減小的趨勢,則稱兩個變量負(fù)相關(guān).
它主要用于相關(guān)量的顯著性檢驗,以衡量它們之間的線性相關(guān)程度.當(dāng) r>0 時表示兩個變量正相關(guān),當(dāng) r<0 時表示兩個變量負(fù)相關(guān).|r|越接近 1,表明兩個變量的線性相關(guān)性越強;當(dāng)|r|接近 0 時,表明兩個變量間幾乎不存在相關(guān)關(guān)系,相關(guān)性越弱.
設(shè) X,Y 為兩個分類變量,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(2×2 列聯(lián)表)如下:
a+b+c+d 為樣本容量)來判斷“兩個變量有關(guān)系”的方法稱為獨立性檢驗.
(3)獨立性檢驗的一般步驟①根據(jù)樣本數(shù)據(jù)列出2×2列聯(lián)表;②計算隨機變量χ2的值,查表確定臨界值xα;③如果χ2≥xα,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過P(χ2≥xα);否則,就認(rèn)為在犯錯誤的概率不超過P(χ2≥xα)的前提下不能推斷“X與Y有關(guān)系”.
(1)回歸分析是對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的方法,只有在散點圖大致呈線性分布時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義.根據(jù)回歸方程進(jìn)行預(yù)報,僅是一個預(yù)報值,而不是真實發(fā)生的值.
(2)獨立性檢驗是對兩個變量的關(guān)系的可信程度的判斷,而不是對其是否有關(guān)系的判斷.根據(jù)χ2 的值可以判斷兩個分類變量有關(guān)的可信程度,并用來指導(dǎo)科研和實際生活.
1.判斷下列結(jié)論正誤(在括號內(nèi)打“√”或“×”)(1)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)
生的水平成正相關(guān)關(guān)系.(
(3)因為由任何一組觀測值都可以求得一個線性回歸
方程,所以沒有必要進(jìn)行相關(guān)性檢驗.(
(4)事件 X,Y 關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的
χ2 的觀測值越大.(
2.(教材改編題)為調(diào)查中學(xué)生近視情況,測得某校 150名男生中有 80 名近視,140 名女生中有 70 名近視.在檢驗這些學(xué)生眼睛近視是否與性別有關(guān)時,用下列哪種方法最
B.均值與方差D.概率
A.回歸分析C.獨立性檢驗答案:C
3.(教材改編題)兩個變量 y 與 x 的回歸模型中,分別選擇了 4 個不同模型,它們的相關(guān)指數(shù) R2 如下,其中擬合效
A.模型 1 的相關(guān)指數(shù) R2 為 0.98B.模型 2 的相關(guān)指數(shù) R2 為 0.80C.模型 3 的相關(guān)指數(shù) R2 為 0.50D.模型 4 的相關(guān)指數(shù) R2 為 0.25答案:A
4.(2020 年全國Ⅰ)某校一個課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率 y 和溫度 x(單位:℃)的關(guān)系,在 20 個不同的溫度條件下進(jìn)行種子發(fā)芽實驗,由實驗數(shù)據(jù)(xi,yi)(i=1,2,…,20)得到散點圖(如圖 8-3-1):圖 8-3-1
由此散點圖,在 10 ℃至 40 ℃之間,下面四個回歸方程類型中最適宜作為發(fā)芽率 y 和溫度 x 的回歸方程類型的
B.y=a+bx2D.y=a+bln x
A.y=a+bxC.y=a+bex答案:D
考點一1.觀察下列各圖形,
其中兩個變量 x,y 具有相關(guān)關(guān)系的圖是(
解析:由散點圖知③中的點都分布在一條直線附近.④中的點都分布在一條曲線附近,所以③④中的兩個變量具有相關(guān)關(guān)系.故選 C.
2.(多選題)關(guān)于回歸分析,下列說法正確的是(
A.在回歸分析中,變量間的關(guān)系若是非確定性關(guān)系,那么因變量不能由自變量唯一確定B.線性相關(guān)系數(shù)可以是正的也可以是負(fù)的C.在回歸分析中,如果 r2=1 或 r=±1,說明 x 與 y 之間完全線性相關(guān)D.樣本相關(guān)系數(shù) r∈(-1,1)
解析:選項 D 中,樣本相關(guān)系數(shù)應(yīng)滿足-1≤r≤1,
故 D 錯誤,ABC 都正確.故選 ABC.
3.x 和 y 的散點圖如圖 8-3-2 所示,則下列說法中正確
命題的序號有________.
解析:在散點圖中,點散布在從左上角到右下角的區(qū)域,因此 x,y 是負(fù)相關(guān)關(guān)系,故①正確;由散點圖知用 y正確;x,y 之間可以建立線性回歸方程,但擬合效果不好,故③錯誤.
[例 1](1)(多選題)某市物價部門對 5 家商場的某商品一天的銷售量及其價格進(jìn)行調(diào)查,5 家商場的售價 x(元)和銷售量 y(件)之間的一組數(shù)據(jù)如表所示:
(2)某農(nóng)科所實地考察,研究發(fā)現(xiàn)某貧困村適合種植兩種藥材,可以通過種植這兩種藥材脫貧,通過大量考察研究得知藥材 A 的畝產(chǎn)量約為 300 kg,其收購價格處于上漲趨勢,最近五年的價格如下表:
藥材 B 的收購價格始終為 20 元/kg,其畝產(chǎn)量的頻率
分布直方圖如圖 8-3-3,
(1)若藥材 A 的單價 y(單位:元/kg)與年份編號 x 具有線性相關(guān)關(guān)系,請求出 y 關(guān)于 x 的回歸直線方程,并估計2023 年藥材 A 的單價;(2)用上述頻率分布直方圖估計藥材 B 的平均畝產(chǎn)量,若不考慮其他因素,試判斷 2023 年該村應(yīng)種植藥材 A 還是藥材 B?并說明理由.
(2)由(1)知,2023 年種植藥材 A 的收入為 39.2×300=
由頻率分布直方圖可知,(360×0.005+380×0.01+400×0.017 5+420×0.012 5+440×0.005)×20=401,
∴藥材 B 的平均畝產(chǎn)量為 401 kg,
∵藥材 B 的收購價格始終為 20 元/kg,
∴2023 年種植藥材 B 的收入為 20×401=8 020<
故 2023 年該村應(yīng)種植藥材 A.
【題后反思】回歸分析問題的類型及解題方法(1)求經(jīng)驗回歸方程
①根據(jù)散點圖判斷兩變量是否線性相關(guān),如不是,應(yīng)
通過換元構(gòu)造線性相關(guān).
②利用公式,求出回歸系數(shù) .
③利用經(jīng)驗回歸直線過樣本點的中心求系數(shù)a.
(2)利用經(jīng)驗回歸方程進(jìn)行預(yù)測時,可把經(jīng)驗回歸方程
看作一次函數(shù)求函數(shù)值.
(3)利用經(jīng)驗回歸方程判斷正、負(fù)相關(guān)時,決定是正相
關(guān)還是負(fù)相關(guān)的是系數(shù) .
(4)判斷經(jīng)驗回歸方程的擬合效果,可以利用樣本相關(guān)系數(shù)判斷,|r|越趨近于 1,兩變量的線性相關(guān)性越強.
某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解這種產(chǎn)品的年廣告費支出 x(單位:萬元)對年銷售額 y(單位:萬元)的影響,對近 5 年的年廣告費支出 x 和年銷售額y 進(jìn)行統(tǒng)計,得到如下數(shù)據(jù):
(1)請根據(jù)表中數(shù)據(jù),建立 y 與 x 的經(jīng)驗回歸方程;(2)當(dāng)年廣告費支出為 10 萬元時,估計年銷售額 y 的預(yù)報值是多少萬元?附:回歸方程中斜率和截距的最?。斯烙嫻椒謩e
(2)當(dāng) x=10 時, =6.5×10+17.5=82.5(萬元),所以當(dāng)年廣告費支出為 10 萬元時,估計年銷售額 y
的預(yù)報值是 82.5 萬元.
[例 2]電視傳媒公司為了解某地區(qū)觀眾對“中國詩詞大會”的收視情況,隨機抽取了 100 名觀眾進(jìn)行調(diào)查,其中女性有 55 名.將日均收看該節(jié)目時間不低于 40 分鐘的觀眾稱為“詩詞迷”,已知“詩詞迷”中有 15 名男性,“非詩詞迷”共有 75 名.
(1)根據(jù)已知條件完成下面的 2×2 列聯(lián)表,并據(jù)此資料判斷是否有 95%的把握認(rèn)為是否為“詩詞迷”與性別有關(guān)?
(2)采用分層隨機抽樣的方式從“詩詞迷”中任意選取 5 人進(jìn)行問卷調(diào)查,若再從這 5 人中任意選取 2 人獎勵詩詞大禮包,求選取的 2 人為一位男性一位女性的概率.
解:(1)在抽取的 100 個人中,“非詩詞迷”共有 75名,則“詩詞迷”有 25 人,女性有 55 名,所以 2×2 列聯(lián)表如下:
所以沒有 95%的把握認(rèn)為是否為“詩詞迷”與性別有關(guān).
新型冠狀病毒的傳染主要是人與人之間進(jìn)行傳播,感染人群年齡大多數(shù)是 50 歲以上人群.該病毒進(jìn)入人體后有潛伏期,潛伏期是指病原體侵入人體至最早出現(xiàn)臨床癥狀的這段時間,潛伏期越長,感染到他人的可能性越高,現(xiàn)對 400 個病例的潛伏期(單位:天)進(jìn)行調(diào)查,如果認(rèn)為超過 8 天的潛伏期屬于“長潛伏期”,按照年齡統(tǒng)計樣本,50 歲以上人數(shù)占 70%,長期潛伏人數(shù)占 25%,其中 50 歲以上長期潛伏者有 60 人.
(1)請根據(jù)以上數(shù)據(jù)完成 2×2 列聯(lián)表;單位:人
(2)判斷是否有 95% 的把握認(rèn)為是否是“長期潛伏”者與年齡有關(guān).
解:(1)根據(jù)題目所給數(shù)據(jù)得到如下 2×2 列聯(lián)表,單
3.841,所以有 95%以上的把握認(rèn)為是否是“長期潛伏者”與年齡有關(guān).
⊙非線性回歸的應(yīng)用問題
[例 3]為了研究一種昆蟲的產(chǎn)卵數(shù) y(單位:個)和溫度x(單位:℃)是否有關(guān),現(xiàn)收集了 7 組觀測數(shù)據(jù)列于下表中,并作出了如圖 8-3-4 所示的散點圖,發(fā)現(xiàn)樣本點沒有分布在某個帶狀區(qū)域內(nèi),兩個變量不呈線性相關(guān)關(guān)系,現(xiàn)分別
和溫度 x 的回歸方程來建立兩個變量之間的關(guān)系.
(1) 分別在圖 8-3-5(1)(2)中畫出 y 關(guān)于 t 的散點圖和 z關(guān)于 x 的散點圖,根據(jù)散點圖判斷哪一個模型更適合作為昆蟲的產(chǎn)卵數(shù) y 關(guān)于溫度 x 的回歸方程.(給出判斷即可,不必說明理由)
解:(1)畫出 y 關(guān)于 t 的散點圖,如圖 8-3-6 所示.
畫出 z 關(guān)于 x 的散點圖,如圖 8-3-7 所示.
根據(jù)散點圖可以判斷模型②更適合作為昆蟲的產(chǎn)卵數(shù)
y 關(guān)于溫度 x 的回歸方程類型.
【反思感悟】非線性回歸方程的求法(1)根據(jù)原始數(shù)據(jù)作出散點圖;
(2)根據(jù)散點圖,選擇恰當(dāng)?shù)臄M合函數(shù);
(3)作恰當(dāng)變換,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方
(4)在(3)的基礎(chǔ)上通過相應(yīng)變換,即可得非線性回歸方
1.(2021 年昌江期中)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費 x(單位:千元)對年銷售量y(單位:t)和年利潤 z(單位:千元)的影響,對近 8 年的宣傳費xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到散點圖(如圖 8-3-8)及一些統(tǒng)計量的值.
(1)根據(jù)散點圖判斷 y=a+bx 與 y=c+d ,哪一個適合作為年銷售量 y 關(guān)于年宣傳費 x 的回歸方程類型;(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立 y 關(guān)于 x 的回
(3)已知這種產(chǎn)品的年利潤 z 與 x,y 的關(guān)系為 z=
0.2y-x,根據(jù)(2)的結(jié)果回答下列問題:
①當(dāng)年宣傳費 x=49 時,年銷售量及年利潤的預(yù)報值
②當(dāng)年宣傳費 x 為何值時,年利潤的預(yù)報值最大?
2.(2021 年汕頭模擬)二手車經(jīng)銷商小王對其所經(jīng)營的A 型號二手汽車的使用年數(shù) x 與銷售價格 y(單位:萬元/輛)進(jìn)行整理,得到如下數(shù)據(jù):
下面是 z 關(guān)于 x 的折線圖:
(1)由折線圖可以看出,可以用線性回歸模型擬合 z 與
x 的關(guān)系,請用相關(guān)系數(shù)加以說明;
(2)求 y 關(guān)于 x 的回歸方程,并預(yù)測某輛 A 型號二手車當(dāng)使用年數(shù)為 9 年時售價約為多少?(b,a 小數(shù)點后保留兩位有效數(shù)字)
(3)基于成本的考慮,該型號二手車的售價不得低于 7118 元,請根據(jù)(2)求出的回歸方程預(yù)測在收購該型號二手車時車輛的使用年數(shù)不得超過多少年?
這是一份2025屆高考數(shù)學(xué)一輪總復(fù)習(xí)第十章統(tǒng)計與成對數(shù)據(jù)的統(tǒng)計分析第二節(jié)成對數(shù)據(jù)的統(tǒng)計分析課件,共60頁。PPT課件主要包含了內(nèi)容索引,強基礎(chǔ)增分策略,增素能精準(zhǔn)突破,樣本相關(guān)系數(shù),2經(jīng)驗回歸方程,2獨立性檢驗,答案C,典例突破等內(nèi)容,歡迎下載使用。
這是一份2025版高考數(shù)學(xué)一輪總復(fù)習(xí)第9章統(tǒng)計成對數(shù)據(jù)的統(tǒng)計分析第2講成對數(shù)據(jù)的統(tǒng)計分析課件,共60頁。PPT課件主要包含了去精確地決定,正相關(guān)或負(fù)相關(guān),一條直線,相關(guān)或曲線相關(guān),非線性,正相關(guān),負(fù)相關(guān),bx+a+e,因變量或響應(yīng)變量,自變量或解釋變量等內(nèi)容,歡迎下載使用。
這是一份適用于新高考新教材備戰(zhàn)2025屆高考數(shù)學(xué)一輪總復(fù)習(xí)第10章統(tǒng)計與成對數(shù)據(jù)的統(tǒng)計分析第3節(jié)成對數(shù)據(jù)的統(tǒng)計分析課件新人教A版,共52頁。PPT課件主要包含了強基礎(chǔ)固本增分,研考點精準(zhǔn)突破,目錄索引,樣本相關(guān)系數(shù),正相關(guān),負(fù)相關(guān),2經(jīng)驗回歸方程,2獨立性檢驗,參考數(shù)據(jù)等內(nèi)容,歡迎下載使用。
高考數(shù)學(xué)一輪總復(fù)習(xí)課件第8章統(tǒng)計與統(tǒng)計分析第3講成對數(shù)據(jù)的統(tǒng)計分析(含解析)
新教材適用2024版高考數(shù)學(xué)一輪總復(fù)習(xí)第9章統(tǒng)計成對數(shù)據(jù)的統(tǒng)計分析第3講成對數(shù)據(jù)的統(tǒng)計分析課件
高考數(shù)學(xué)一輪復(fù)習(xí)第9章第3節(jié)成對數(shù)據(jù)的統(tǒng)計分析課件
(新高考)高考數(shù)學(xué)一輪復(fù)習(xí)課件第9章§9.3《成對數(shù)據(jù)的統(tǒng)計分析》(含解析)
注冊成功