
?8.2 一元線性回歸模型及其應(yīng)用
課程標(biāo)準(zhǔn)
課標(biāo)解讀
1. 了解一元線性回歸模型的含義,理解兩
個變量之間隨機關(guān)系的一元線性回歸模型的作用與意義;
2. 了解殘差在線性回歸與非線性回歸問
題的作用及意義;
3. 了解一元線性回歸模型參數(shù)與最小二
乘估計的推導(dǎo)過程,理解最小二乘估計的原理;
4. 會結(jié)合題意求一元線性回歸方程;
5. 會用相關(guān)指數(shù)進行分析模型擬合的效
果情況.
通過本節(jié)課的學(xué)習(xí),要求會求一元線性回歸方程,會進行殘差分析,能判斷回歸模型的擬合效果,能利用樣本數(shù)據(jù)建立統(tǒng)計模型并能進行預(yù)測.
知識點1 一元線性回歸模型
(1)一元線性回歸模型
稱為Y關(guān)于x的一元線性回歸模型.其中Y稱為因變量或響應(yīng)變量,x稱為自變量或解釋變量,a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的隨機誤差,如果e=0,那么Y與x之間的關(guān)系就可以用一元線性函數(shù)模型來描述.
(2)隨機誤差
在線性回歸模型中,和為模型的未知參數(shù),是與之間的誤差,通常為隨機變量,稱為隨機誤差.它的均值,方程.
線性回歸模型的完整表達(dá)式為 , 在此模型中,隨機誤差的方差越小,用預(yù)報真實值的精度越高.
【即學(xué)即練1】【多選】以下四個散點圖中,兩個變量的關(guān)系適合用線性回歸模型刻畫的是( )
【解析】AC中的點分布在一條直線附近,適合線性回歸模型.故選AC
【即學(xué)即練2】某個男孩的年齡與身高的統(tǒng)計數(shù)據(jù)如下表所示.
年齡(歲)
1
2
3
4
5
6
身高(cm)
78
87
98
108
115
120
其散點圖如下,則與________(填“具有”或“不具有”)線性相關(guān)關(guān)系.
【答案】具有
【詳解】解:由散點圖可知,所有數(shù)據(jù)點由左下方到右上方接近一條直線排列,
因此與具有線性相關(guān)關(guān)系;
故答案為:具有
知識點2 最小二乘法
將=x+稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線,這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估計,其中
,=-.
思考1 經(jīng)驗回歸方程一定過成對樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)中的某一點嗎?
答案 不一定.
備注 ①經(jīng)驗回歸直線一定過點,點通常稱為樣本點的中心;
②一次函數(shù)的單調(diào)性由的符號決定,函數(shù)遞增的充要條件是;函數(shù)遞減的充要條件是.這說明:與正相關(guān)的充要條件是;與負(fù)相關(guān)的充要條件是.
③在經(jīng)驗回歸方程中,是經(jīng)驗回歸直線的斜率,是截距.一般地,當(dāng)回歸系數(shù)時,說明兩個變量呈正相關(guān)關(guān)系,它的意義是當(dāng)每增大一個單位時,平均增大個單位;當(dāng)時,說明兩個變量呈負(fù)相關(guān)關(guān)系,它的意義是當(dāng)每增大一個單位時,平均減小個單位.
【即學(xué)即練3】根據(jù)如下樣本數(shù)據(jù),得到線性回歸方程為,若樣本點的中心為,則當(dāng)X每增加1個單位時,平均(????)
3
4
5
6
7
4.0
-0.5
0.5
A.增加1.4個單位 B.減少1.4個單位 C.增加7.9個單位 D.減少7.9個單位
【答案】B
【詳解】樣本點的中心為,則,故,且,
解得,,則,可知當(dāng)X每增加1個單位時,
Y平均減少1.4個單位.
故選:B.
【即學(xué)即練4】某企業(yè)為了研究某種產(chǎn)品的銷售價格(元)與銷售量(千件)之間的關(guān)系,通過大量市場調(diào)研收集得到以下數(shù)據(jù):
16
12
8
4
24
38
64
其中某一項數(shù)據(jù)※丟失,只記得這組數(shù)據(jù)擬合出的線性回歸方程為:,則缺失的數(shù)據(jù)是(????)A.33 B.35 C.34 D.34.8
【答案】C
【詳解】因為點一定在回歸方程上,
所以將,代入
解得.
故選:C.
【即學(xué)即練5】某市物價部門對本市的5家商場的某商品的一天銷售量及其售價進行調(diào)查,5家商場的售價(元)和銷售量(件)之間的一組數(shù)據(jù)如下表所示:
售價(元)
9
9.5
10.5
11
銷售量(件)
11
8
6
5
已知銷售量與售價之間有較強的線性相關(guān)關(guān)系,其線性回歸方程是,且,則其中的______,樣本中心為______.
【答案】???? 10????
【詳解】解:因為回歸直線一定經(jīng)過樣本中心,
,,
所以,整理得.
又,得方程組,解得,
進而得,
所以,樣本中心為.
故答案為:10;
【即學(xué)即練6】小張準(zhǔn)備在某縣城開一家文具店,為經(jīng)營需要,小張對該縣城另一家文具店中的某種水筆的單支售價及相應(yīng)的日銷售量進行了調(diào)查,單支售價(元)和日銷售量(支)之間的數(shù)據(jù)如表所示;
單支售價(元)
1.4
1.6
1.8
2
2.2
日銷售量(支)
13
11
7
6
3
(1)根據(jù)表格中的數(shù)據(jù),求出關(guān)于的回歸直線方程;
(2)請由(1)所得的回歸直線方程預(yù)測日銷售量為18支時.單支售價應(yīng)定為多少元?如果一支水筆的進價為0.56元,為達(dá)到日利潤(日利潤=日銷售量×單支售價-日銷售量×單支進價)最大,在(1)的前提下應(yīng)該如何定價?
參考公式:
參考數(shù)據(jù):
【答案】(1)
(2)1,
(1),,
,,
則y關(guān)于x的回歸直線方程:.
(2)當(dāng)時,可得,解得,
設(shè)日利潤為,則,
由配方法可得:,則當(dāng)時,取得日利潤最大值.
【即學(xué)即練7】為了研究甲型H1N1中的某種細(xì)菌隨時間x變化的繁殖個數(shù)y,收集數(shù)據(jù)如下:
天數(shù)x
1
2
3
4
5
6
繁殖個數(shù)y
6
12
25
49
95
190
求y關(guān)于x的非線性經(jīng)驗回歸方程.
【解析】作出散點圖如圖(1)所示.
由散點圖看出樣本點分布在一條指數(shù)型曲線y=cebx的周圍,則ln y=bx+ln c.
令z=ln y,a=ln c,則z=bx+a.
x
1
2
3
4
5
6
z
1.79
2.48
3.22
3.89
4.55
5.25
相應(yīng)的散點圖如圖(2)所示.從圖(2)可以看出,變換后的樣本點分布在一條直線附近,因此可以用經(jīng)驗回歸方程來擬合.
由表中數(shù)據(jù)得到經(jīng)驗回歸方程為=0.69x+1.115.因此細(xì)菌的繁殖個數(shù)y關(guān)于天數(shù)x的非線性經(jīng)驗回歸方程為=e0.69x+1.115.
知識點3 殘差與殘差分析
1.殘差
對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗回歸方程得到的稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.
2.殘差分析
殘差是隨機誤差的估計結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.通過觀察殘差圖可以直觀判斷模型是否滿足一元線性回歸模型中對隨機誤差的假設(shè),那殘差應(yīng)是均值為0,方差為σ2的隨機變量的觀測值.
【即學(xué)即練8】已知與之間的數(shù)據(jù)如下表:
(1)求關(guān)于的線性回歸方程;
(2)完成下面的殘差表:
并判斷(1)中線性回歸方程的回歸效果是否良好(若,則認(rèn)為回歸效果良好).
附:,,,.
【答案】(1);(2)表格見解析,良好.
【詳解】(1)由已知圖表可得,,,,
則,,
故.
(2)∵,∴,,,,,則殘差表如下表所示,
∵ ,
∴,
∴該線性回歸方程的回歸效果良好.
知識點4 對模型刻畫數(shù)據(jù)效果的分析
1.殘差圖法
作圖時縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘差圖.在殘差圖中,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預(yù)報精度越高.
2.殘差平方和法
殘差平方和越小,模型的擬合效果越好.
3.R2法
在回歸分析中,可以用來刻畫回歸的效果,它表示解釋變量對于預(yù)報變量變化的貢獻(xiàn)率,R2越接近于1,表示回歸的效果越好.
模型的擬合效果用相關(guān)指數(shù)來表示,,表達(dá)式中,與經(jīng)驗回歸方程無關(guān),殘差平方和與經(jīng)驗回歸方程有關(guān),因此,越大,意味著殘差平方和越小,即模型的擬合效果越好;越小,殘差平方和越大,即模型的擬合效果越差
注:決定系數(shù)與相關(guān)系數(shù)的聯(lián)系與區(qū)別
①相關(guān)系數(shù)反映兩個變量的相關(guān)關(guān)系的強弱及正相關(guān)或負(fù)相關(guān),決定系數(shù)反映回歸模型的擬合效果.
②在含有一個解釋變量的線性模型中,決定系數(shù)的數(shù)值是相關(guān)系數(shù)的平方,其變化范圍為,而相關(guān)系數(shù)的變化范圍為.
③當(dāng)相關(guān)系數(shù)接近于1時,說明兩變量的相關(guān)性較強,當(dāng)接近于0時,說明兩變量的相關(guān)性較弱;而當(dāng)接近于1時,說明經(jīng)驗回歸方程的擬合效果較好.
【即學(xué)即練9】甲、乙、丙、丁四位同學(xué)在建立變量x,y的回歸模型時,分別選擇了4種不同模型,計算可得它們的決定系數(shù)R2分別如下表:
甲
乙
丙
丁
R2
0.98
0.78
0.50
0.85
哪位同學(xué)建立的回歸模型擬合效果最好( )
A.甲 B.乙 C.丙 D.丁
【解析】決定系數(shù)R2越大,表示回歸模型的擬合效果越好.故選A
【即學(xué)即練10】教育部印發(fā)的《義務(wù)教育課程方案和課程標(biāo)準(zhǔn)(2022年版)》指出,自2022年秋季開始,勞動課將成為中小學(xué)一門獨立課程.消息一出,“中小學(xué)生學(xué)做飯”等相關(guān)話題引發(fā)大量網(wǎng)友關(guān)注,兒童廚具也迅速走俏.這類兒童廚具并不是指傳統(tǒng)意義上的“過家家”,而是真鍋真鏟真爐灶,能讓孩子煎炒烹炸,把飯菜做熟了吃下肚的“真煮”兒童廚具.一家廚具批發(fā)商從2022年5月22日起,每10天就對“真煮”兒童廚具的銷量統(tǒng)計一次,得到相關(guān)數(shù)據(jù)如下表所示.
時間
5月22~31日
6月1~10日
6月11~20日
6月21~30日
7月1~10日
7月11~20日
7月21~30日
時間代碼
1
2
3
4
5
6
7
銷量/千件
9.4
9.6
9.9
10.1
10.6
11.1
11.4
根據(jù)表中數(shù)據(jù),判斷與是否具有線性相關(guān)關(guān)系?若具有,試求出關(guān)于的線性回歸方程;若不具有,請說明理由.(結(jié)果保留兩位小數(shù))
附:線性回歸方程中斜率和截距的最小二乘估計公式分別為,,相關(guān)系數(shù),.
【答案】y與x具有線性相關(guān)關(guān)系,y關(guān)于x的線性回歸方程為.
【詳解】由表格數(shù)據(jù),得,
,
所以,
,
,
所以相關(guān)系數(shù).
因為相關(guān)系數(shù),接近1,所以y與x具有線性相關(guān)關(guān)系,且正相關(guān)性很強.
因為,
所以,
所以y關(guān)于x的線性回歸方程為.
考點一 根據(jù)散點圖判斷線性相關(guān)
1.(2023·高二課時練習(xí))在下列所示的四個圖中,兩個變量間具有較強線性相關(guān)關(guān)系的是(????)
A. B.C.D.
【答案】B
【分析】由散點圖可得答案.
【詳解】對于A,散點落在某條曲線上,兩個變量具有函數(shù)關(guān)系;
對于B,散點落在某條直線附近,這兩個變量具有線性相關(guān)關(guān)系;
對于C,散點落在某條曲線附近,這兩個變量具有非線性相關(guān)關(guān)系;
對于D,散點雜亂無章,無規(guī)律可言,這兩個變量無相關(guān)性,不具有相關(guān)關(guān)系.
故選:B.
2.(2023春·高二課時練習(xí))如圖是根據(jù)的觀測數(shù)據(jù)得到的散點圖,可以判斷變量,具有線性相關(guān)關(guān)系的圖是(????)
A.①② B.③④ C.②③ D.①④
【答案】B
【分析】根據(jù)變量具有線性相關(guān)關(guān)系,則散點在某條直線附近,從左下至右上或從左上至右下即可.
【詳解】根據(jù)變量具有線性相關(guān)關(guān)系,則散點在某條直線附近,從左下至右上或從左上至右下,
所以③④圖的變量具有線性相關(guān)關(guān)系.
故選:B
3.(2023·高二課時練習(xí))變量x,y的散點圖如圖所示,根據(jù)散點圖,下面四個回歸方程類型中最適宜作為y和x的回歸方程類型的是(????).
A. B. C. D.
【答案】B
【分析】根據(jù)散點圖據(jù)曲線形狀結(jié)合一次函數(shù),二次函數(shù),反比例函數(shù)及冪函數(shù)的性質(zhì)判斷即得.
【詳解】由散點圖可以看出y隨著x的增長速度越來越快,結(jié)合一次函數(shù),二次函數(shù),反比例函數(shù)及冪函數(shù)的性質(zhì)可知,
最適宜作為y和x的回歸方程類型的是:.
故選:B.
4.(2023·全國·高三專題練習(xí))在一項調(diào)查中有兩個變量和,如圖是由這兩個變量近年來的取值數(shù)據(jù)得到的散點圖,那么適宜作為關(guān)于的回歸方程的函數(shù)類型是(????)
A. B. C. D.
【答案】B
【分析】根據(jù)散點圖,結(jié)合指數(shù)函數(shù),對數(shù)函數(shù),冪函數(shù)的圖像性質(zhì)判斷即可.
【詳解】解:散點圖呈曲線,A中函數(shù)為線性函數(shù),不合題意,排除選項;
由散點圖可知整體呈增長態(tài)勢,且增長速度變慢,
對B選項中函數(shù),當(dāng)時,函數(shù)為單調(diào)遞增函數(shù),且增長速度逐漸變慢,符合題意,故B正確;
對于C選項,當(dāng)時,函數(shù)為開口向上的二次函數(shù),增長先慢后快,不合題意,
當(dāng)時,函數(shù)為開口向下的二次函數(shù),增長先慢后快,不合題意,排除選項C;
對于D選項,函數(shù)為指數(shù)型函數(shù),當(dāng)時單調(diào)遞增,且越增越快,不合題意,
當(dāng)時為單調(diào)遞減函數(shù),不合題意,故排除D;
故選:B
5.(2023·全國·高三專題練習(xí))2020年春季,新冠肺炎疫情在全球范圍內(nèi)相繼爆發(fā),因為政治制度、文化背景等因素的不同,各個國家疫情防控的效果具有明顯差異、如圖是西方某國在60天內(nèi)感染新冠肺炎的累計病例人數(shù)y(萬人)與時間t(天)的散點圖,則下列最適宜作為此模型的回歸方程的類型是(???)
A. B.
C. D.
【答案】C
【分析】根據(jù)散點圖,根據(jù)常見函數(shù)的圖象即得.
【詳解】根據(jù)散點圖,可以看出,散點大致分布在一條“指數(shù)型”函數(shù)曲線附近,
選項A對應(yīng)的“直線型”的擬合函數(shù);
選項B對應(yīng)的“冪函數(shù)型”的擬合函數(shù);
選項D對應(yīng)的“對數(shù)型”的擬合函數(shù);
故選:C.
考點二 求經(jīng)驗回歸方程
解題方略:
求經(jīng)驗回歸方程的步驟
①作出散點圖,判斷兩變量是否具有線性相關(guān)關(guān)系,若具有線性相關(guān)關(guān)系,則可求其經(jīng)驗回歸方程;
②列表求出,的值;
③利用公式先計算,再根據(jù)經(jīng)驗回歸直線過樣本點的中心計算;
④寫出經(jīng)驗回歸方程.
求經(jīng)驗回歸方程,關(guān)鍵在于正確求出系數(shù),,由于計算量較大,所以計算時要仔細(xì)謹(jǐn)慎、分層進行,避免因計算產(chǎn)生錯誤要特別注意,只有兩個變量呈線性相關(guān)關(guān)系時,求出的經(jīng)驗回歸方程才有意義.
6.(2023·江西·高二校聯(lián)考階段練習(xí))向日葵游樂園最近推出一款“摩天飛毯”游樂項目,游客可以購票乘坐“摩天飛毯”到達(dá)山頂玻璃橋進行游走觀光.為了解購票人數(shù)與票價的關(guān)系,游樂園進行了連續(xù)5天的票價浮動試運營.這五天每天的票價(元)與對應(yīng)購票人數(shù)(人)如下表所示:
票價x(元/每人)
6
8
10
12
14
當(dāng)天購票人數(shù)y(人)
110
90
80
70
50
(1)根據(jù)數(shù)據(jù),求出y關(guān)于x的回歸方程;
(2)假設(shè)游樂園每天“摩天飛毯”的項目成本只跟當(dāng)天的乘坐人數(shù)有關(guān),并且人均成本是1元,試依據(jù)(1)中的關(guān)系,求出當(dāng)票價應(yīng)定為多少元,游樂園才能在該項目上獲得最大利潤.(注:利潤=售票收入-成本)
附:回歸方程中,;
參考數(shù)據(jù):,.
【答案】(1)
(2)11元
【分析】(1)先求出 和 ,再按照公式計算 和 ;
(2)根據(jù)題意求出利潤的函數(shù)解析式求解.
【詳解】(1),,
∴,
,
∴回歸方程為;
(2)設(shè)游樂園能獲得利潤z元,則,
∴, ,
由二次函數(shù)知識可得, , 當(dāng)元時,z取得最大值,
∴“摩天飛毯”票價應(yīng)定為11元,游樂園才能在該項目上獲得最大利潤;
綜上,回歸方程為,摩天飛毯”票價應(yīng)定為11元,游樂園才能在該項目上獲得最大利潤.
7.(2023·全國·模擬預(yù)測)某農(nóng)科所統(tǒng)計了單位面積某種化肥實施量x(kg)和玉米相應(yīng)產(chǎn)量Y(kg)的相關(guān)數(shù)據(jù),制作了數(shù)據(jù)對照表:
x(kg)
16
20
24
29
36
Y(kg)
340
350
362
404
454
若在合理施肥范圍內(nèi)x與Y具有線性相關(guān)關(guān)系,
(1)求Y關(guān)于x的線性回歸方程;
(2)請利用線性回歸方程預(yù)測時的玉米產(chǎn)量.
附:回歸直線的斜率和截距的最小二乘法估計公式分別為:,.
【答案】(1)
(2)
【分析】(1)利用最小二乘法求解;
(2)將代入回歸方程求解.
【詳解】(1)解:由表中數(shù)據(jù)計算得,.,
,,
,
.
所以回歸方程為.
(2)將代入回歸方程得.
故預(yù)測時,玉米產(chǎn)量約為.
8.(2023·浙江·統(tǒng)考二模)2023年是全面貫徹落實黨二十大精神的開局之年,也是實施“十四五”規(guī)劃承上啟下的關(guān)鍵之年,今年春季以來,各地出臺了促進經(jīng)濟發(fā)展的各種措施,經(jīng)濟增長呈現(xiàn)穩(wěn)中有進的可喜現(xiàn)象.服務(wù)業(yè)的消費越來越火爆,紹興一些超市也紛紛加大了廣告促銷.現(xiàn)隨機抽取7家超市,得到其廣告支出x(單位:萬元)與銷售額y(單位:萬元)數(shù)據(jù)如下:
超市
A
B
C
D
E
F
G
廣告支出
1
2
4
6
10
13
20
銷售額
19
32
44
40
52
53
54
(1)建立關(guān)于的一元線性回歸方程(系數(shù)精確到0.01);
(2)若將超市的銷售額與廣告支出的比值稱為該超市的廣告效率值,當(dāng)時,稱該超市的廣告為“好廣告”.從這7家超市中隨機抽取4家超市,記這4家超市中“好廣告”的超市數(shù)為,求的分布列與期望.
附注:參考數(shù)據(jù),回歸方程中斜率和截距的最小二乘估計公式分別為:.
【答案】(1)
(2)分布列見解析,期望為
【分析】(1)首先計算,再根據(jù)參考公式和數(shù)據(jù),分別計算和,即可求解;
(2)根據(jù)超幾何分布求概率,再根據(jù)分布列求期望.
【詳解】(1)由數(shù)據(jù)可得;
,
又,
,
.
.
(2)由題知,7家超市中有3家超市的廣告是“好廣告”,X的可能取值是0,1,2,3
.
.
所以的分布列為
0
1
2
3
所以.
9.(2023·全國·高三專題練習(xí))某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:)和材積量(單位:),得到如下數(shù)據(jù):
樣本號i
1
2
3
4
5
6
7
8
9
10
平均值
根部橫截面積
0.04
0.06
0.04
0.08
0.08
0.05
a
b
c
0.07
0.06
材積量
0.25
0.41
0.22
0.54
0.53
0.34
0.35
0.39
0.43
0.44
0.39
其中a,b,c為等差數(shù)列,并計算得:,,.
(1)求b的值;
(2)若選取前6個樣本號對應(yīng)數(shù)據(jù),判斷這種樹木的根部橫截面積與材積量是否具有很強的線性相關(guān)性,并求該林區(qū)這種樹木的根部橫截面積與材積量的回歸直線方程(若,則認(rèn)為兩個變量的線性相關(guān)性一般;若,則認(rèn)為兩個變量的線性相關(guān)性很強);
附:相關(guān)系數(shù),
回歸直線中,,.
(3)根據(jù)回歸直線方程估計a,c的值(精確到0.01).
【答案】(1)b=0.06
(2)這種樹木的根部橫截面積與材積量具有很強的線性相關(guān)性,
(3)a≈0.05,c≈0.07.
【分析】(1)由a,b,c為等差數(shù)列及表格中數(shù)據(jù)的平均值,解得b的值;
(2)利用相關(guān)系數(shù)計算公式判斷線性相關(guān)性強弱,利用回歸方程計算公式求回歸方程;
(3)利用(2)求得方程,計算a,c.
【詳解】(1)由a,b,c為等差數(shù)列,得,由表格得該樹木根部橫截面積的平均值為,
可得,
故,解得.
(2)由已知得,
,
相關(guān)系數(shù),故這種樹木的根部橫截面積與材積量具有很強的線性相關(guān)性.
,,
所以該林區(qū)這種樹木的根部橫截面積與材積量的回歸直線方程為.
(3)由表格數(shù)據(jù)可得,根部橫截面積為a,c時對應(yīng)的材積量分別為,,
代入回歸直線方程分別得,,解得,.
10.(2023·陜西·統(tǒng)考一模)疫情過后,某市為了提高市民蔬菜供應(yīng)質(zhì)量,科研所對冬季晝夜溫差的大小與某種反季節(jié)蔬菜的生長的關(guān)系進行研究,他們記錄了當(dāng)?shù)囟灸吃?號到10號的有關(guān)數(shù)據(jù),每天的晝夜溫差和每天每100顆種子中的發(fā)芽數(shù),如下表所示.
日期
6號
7號
8號
9號
10號
溫差x()
10
11
13
12
8
發(fā)芽數(shù)y(顆)
23
25
30
26
16
該科研所的研究方案是:先從這五組數(shù)據(jù)中選取2組,用剩下的3組數(shù)據(jù)求線性回歸方程,再用被選取的2組數(shù)據(jù)進行檢驗.
(1)求選取的兩組數(shù)據(jù)恰好是不相鄰的2天的數(shù)據(jù)的概率;
(2)若選取的是6號10號的兩組數(shù)據(jù),請根據(jù)7號?8號?9號的數(shù)據(jù),求出y關(guān)于x的線性回歸方程;
(3)若由線性回歸方程得到的估計數(shù)據(jù)與所選出的檢驗數(shù)據(jù)的誤差均不超過2顆,則認(rèn)為得到的線性回歸方程是可靠的,試問(2)中所得到的線性回歸方程是否可靠?
(線性回歸方程,其中)
【答案】(1)
(2)
(3)可靠
【分析】(1)利用列舉法寫出基本事件,結(jié)合古典概型的概率的計算公式即可求解;
(2)根據(jù)表中的數(shù)據(jù)求出,,進而即可求出線性回歸方程;
(3)根據(jù)(2)的結(jié)論分別求出和對應(yīng)的預(yù)報值,結(jié)合已知條件即可求解.
【詳解】(1)設(shè)事件“選取的兩組數(shù)據(jù)恰好是不相鄰的2天的數(shù)據(jù)”為事件,
從5組數(shù)據(jù)中選取2組數(shù)據(jù)的所有情況為:,共10種;
選取的2組數(shù)據(jù)恰好是不相鄰的2天的數(shù)據(jù)有:,共6種,
由古典概型的概率公式可知,.
(2)由題設(shè)表格中的數(shù)據(jù)可得:,
,
,
關(guān)于的線性回歸方程為.
(3)當(dāng)時,
,
當(dāng)時,,
,
所以(2)中所得到的線性回歸方程是可靠的.
11.(2023·山東濰坊·??寄M預(yù)測)某農(nóng)科所對冬季大棚內(nèi)的晝夜溫差與某反季節(jié)大豆新品種發(fā)芽率之間的關(guān)系進行分析研究,記錄了2023年1月1日至1月12日大棚內(nèi)的晝夜溫差與每天每100顆種子的發(fā)芽數(shù),得到如下資料:
日期
1日
2日
3日
4日
5日
6日
7日
8日
9日
10日
11日
12日
溫差/℃
10
11
13
12
8
10
9
11
13
10
12
9
發(fā)芽數(shù)/顆
21
24
28
28
15
22
17
22
30
18
27
18
;;;
已知發(fā)芽數(shù)與溫差之間線性相關(guān),該農(nóng)科所確定的研究方案是:先從這12組數(shù)據(jù)中選取2組,用剩下的10組數(shù)據(jù)求線性回歸方程,再用被選取的2組數(shù)據(jù)進行檢驗.
(1)求選取的2組數(shù)據(jù)恰好是相鄰2天的數(shù)據(jù)的概率;
(2)若選取的是1日與6日的兩組數(shù)據(jù),試根據(jù)除這兩日之外的其他數(shù)據(jù),求出關(guān)于的線性回歸方程;(精確到1)
(3)若由線性回歸方程得到的估計數(shù)據(jù)與所選取的檢驗數(shù)據(jù)的誤差均不超過2顆,則認(rèn)為求得的線性回歸方程是可靠的,試問:(2)中所得的線性回歸方程是否可靠.
參考公式:回歸方程中斜率和截距的最小二乘估計公式分別為,.
【答案】(1)
(2)
(3)是可靠的
【分析】(1)利用組合及組合數(shù)公式,結(jié)合古典概型的概率的計算公式即可求解;
(2)根據(jù)已知條件及參考數(shù)據(jù),求出,進而即可求出回歸方程;
(3)利用(2)的回歸方程求出時的預(yù)報值,結(jié)合已知條件即可求解.
【詳解】(1)從組數(shù)據(jù)中任選組,選法數(shù)為;
選取的組數(shù)據(jù)恰好是相鄰的天,選法數(shù)為;
所以所求概率為.
(2)設(shè)剩下的組數(shù)據(jù)分別為.
;
,;
,;
所以
所以.
所以所求回歸方程為.
(3)當(dāng)時,.
因為,
所以根據(jù)所給的研究方案,可以判斷(2)中所得的線性回歸方程是可靠的.
考點三 樣本中心的計算及應(yīng)用
12.(2023·河南·鄭州一中校聯(lián)考模擬預(yù)測)某公司為了解本公司的用電情況,統(tǒng)計了4天氣溫x(℃)與用電量y(度)之間的相關(guān)數(shù)據(jù)如下表所示:
x
9
12
15
18
y
60
m
30
20
若它們之間的線性回歸方程為,則(????)
A.48 B.50 C.52 D.54
【答案】B
【分析】根據(jù)表格中的數(shù)據(jù)求得樣本中心,代入回歸方程,即可求解.
【詳解】根據(jù)表中數(shù)據(jù),得,,將點代入回歸方程得,解得.
故選:B.
13.(2023春·遼寧錦州·高二??茧A段練習(xí))為了解某種產(chǎn)品與原材料之間的關(guān)系,隨機調(diào)查了該產(chǎn)品5個不同時段的產(chǎn)品與原材料的價格,得到如下統(tǒng)計數(shù)據(jù)表:
原材料價格(萬元/噸)
產(chǎn)品價格(萬元/件
但是統(tǒng)計員不小心丟失了一個數(shù)據(jù)(用代替),在數(shù)據(jù)丟失之前得到回歸直線方程為,則的值等于(????)
A. B. C. D.
【答案】A
【分析】先求得樣本中心,再將樣本中心代入回歸直線方程即可求得的值.
【詳解】依題意,得,,
因為必過,
所以,解得,
所以.
故選:A.
14.(2023·高二課時練習(xí))某小區(qū)流感大爆發(fā),當(dāng)?shù)蒯t(yī)療機構(gòu)使用中西醫(yī)結(jié)合的方法取得了不錯的成效,每周治愈的患者人數(shù)如表所示:
周數(shù)(x)
1
2
3
4
5
治愈人數(shù)(y)
5
15
35
?
140
由表格可得y關(guān)于x的線性經(jīng)驗回歸方程為,則測此回歸模型第4周的治愈人數(shù)為(????)
A.105 B.104 C.103 D.102
【答案】A
【分析】設(shè)出第4周的治愈人數(shù)為,得到樣本中心點,代入回歸方程,即可求出.
【詳解】設(shè)第4周的治愈人數(shù)為,
,
樣本中心點為
將代入中,,
解得:.
故選:A
15.(2023·河南開封·開封高中??寄M預(yù)測)2023年春節(jié)到來之前:某市物價部門對本市5家商場的某種商品一天的銷售量及其價格進行調(diào)查,5家商場這種商品的售價x(單位;元)與銷售量y(單位:件)之間的一組數(shù)據(jù)如下表所示:
價格x
8
9.5
m
10.5
12
銷售量y
16
n
8
6
5
經(jīng)分析知,銷售量y件與價格x元之間有較強的線性關(guān)系,其線性回歸直線方程為,且,則(????)
A.12 B.11 C.10 D.9
【答案】C
【分析】由表中數(shù)據(jù)計算、,根據(jù)線性回歸直線方程過點代入化簡求解即可.
【詳解】由表中數(shù)據(jù),計算 ,
,
因為線性回歸直線方程過點,
即,即, 所以,
又因為,所以.
故選∶C﹒
16.(2023春·山東德州·高二??茧A段練習(xí))2020年初以來,技術(shù)在我國已經(jīng)進入高速發(fā)展的階段,手機的銷量也逐漸上升,某手機商城統(tǒng)計了手機5個月的實際銷量,結(jié)果如下表所示:
月份
2020年10月
2020年11月
2020年12月
2021年1月
2021年2月
月份編號
1
2
3
4
5
銷量部
50
96
185
227
若與線性相關(guān),且求得線性回歸方程為,則下列結(jié)論錯誤的是(????)
A.與正相關(guān)
B.與的相關(guān)系數(shù)為負(fù)數(shù)
C.表中
D.預(yù)計2021年7月份該手機商城手機的銷量約為450部
【答案】B
【分析】由回歸方程中的的系數(shù)為正可判斷A,B;由線性回歸方程為恒過求出可判斷C;求出2021年7月份該手機商城手機的銷量可判斷D.
【詳解】由回歸方程中的的系數(shù)為正可知,與正相關(guān),且其相關(guān)系數(shù),故A正確;B錯誤;
對于選項C,由表中數(shù)據(jù),計算得,所以,
于是得,解得,故C正確;
對于選項D,2021年7月份時,,部,故D錯誤.
故選:B.
17.(2023·全國·高二專題練習(xí))某商場為了解銷售活動中某商品銷售量與活動時間之間的關(guān)系,隨機統(tǒng)計了某次銷售活動中的商品銷售量與活動時間,并制作了下表:
活動時間
銷售量
由表中數(shù)據(jù)可知,銷售量與活動時間之間具有線性相關(guān)關(guān)系,算得線性回歸方程為,據(jù)此模型預(yù)測當(dāng)時,的值為(????)
A. B. C. D.
【答案】C
【分析】求出樣本中心點的坐標(biāo),代入回歸直線方程,求出的值,再將代入回歸方程即可得解.
【詳解】由表格中的數(shù)據(jù)可得,,
將樣本中心點的坐標(biāo)代入回歸直線方程可得,解得,
所以,回歸直線方程為,故當(dāng)時,.
故選:C.
18.(2023·全國·高二專題練習(xí))如果在一次實驗中,測得的五組數(shù)值如下表所示:
0
1
2
3
4
10
15
20
30
35
經(jīng)計算知,對的線性回歸方程是,預(yù)測當(dāng)時,(????)
A.47.5 B.48 C.49 D.49.5
【答案】B
【分析】根據(jù)線性回歸方程過樣本中心點,結(jié)合代入法進行求解即可.
【詳解】因為,
所以樣本中心點為,代入中,得,
即,當(dāng)時,,
故選:B
19.(2023·高二課時練習(xí))某社區(qū)醫(yī)院統(tǒng)計了該社區(qū)在夏季某4天患腸道感染類疾病的人數(shù)與平均氣溫(℃)的數(shù)據(jù)如下表,由表中數(shù)據(jù)算得線性回歸方程中的,預(yù)測當(dāng)平均氣溫為35℃時,該社區(qū)患腸道感染類疾病的人數(shù)為(????)
平均氣溫(℃)
22
26
29
32
患腸道感染類疾病的人數(shù)
12
25
27
56
A.57 B.59 C.61 D.65
【答案】C
【分析】由已知數(shù)據(jù)計算,根據(jù)回歸方程的性質(zhì)求,再利用回歸方程預(yù)測當(dāng)平均氣溫為35℃時,該社區(qū)患腸道感染類疾病的人數(shù).
【詳解】由表格數(shù)據(jù)可得,,,
因為點在直線上,,
所以,
所以,
故當(dāng)時,,
即預(yù)測當(dāng)平均氣溫為35℃時,該社區(qū)患腸道感染類疾病的人數(shù)為61,
故選:C.
20.(2023春·湖南長沙·高二長郡中學(xué)校考階段練習(xí))已知的對應(yīng)值表為:
0
1
3
4
5
6
且線性相關(guān),由于表格污損,的對應(yīng)值看不到了,若,且線性回歸直線方程為,則時,的預(yù)報值為(????)
A. B. C. D.
【答案】A
【分析】求出,由線性回歸方程必經(jīng)過點()即得,代入求解即可.
【詳解】由表格知,,
,
代入得:,
,
則回歸方程為,
當(dāng)時,,
故選:A.
【點睛】本題主要考查了線性回歸方程,線性回歸方程的性質(zhì)、應(yīng)用, 屬于中檔題.
21.(2023·江西九江·統(tǒng)考二模)已知變量的關(guān)系可以用模型擬合,設(shè),其變換后得到一組數(shù)據(jù)如下.由上表可得線性回歸方程,則(????)
x
1
2
3
4
5
z
2
4
5
10
14
A. B. C. D.
【答案】B
【分析】根據(jù)樣本中心點在回歸方程上可得,再利用對數(shù)運算法則即可得,所以.
【詳解】由表格數(shù)據(jù)知,.即樣本中心點為,
由,得,
即,
所以,即,可得,
故選:B.
考點四 線性回歸分析
解題方略:
刻畫回歸效果的三種方法
(1)殘差圖法,殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi)說明選用的模型比較合適.
(2)殘差平方和法:殘差平方和越小,模型的擬合效果越好.
(3)R2法:越接近1,表明模型的擬合效果越好.
(一)殘差分析
22.(安徽省安慶市示范高中2023屆高三下學(xué)期4月聯(lián)考數(shù)學(xué)試卷)對于數(shù)據(jù)組,如果由經(jīng)驗回歸方程得到的對應(yīng)自變量的估計值是,那么將稱為對應(yīng)點的殘差.某商場為了給一種新商品進行合理定價,將該商品按事先擬定的價格進行試銷,得到如下所示數(shù)據(jù):
單價x/元
8.2
8.4
8.6
8.8
銷量y/件
84
83
78
m
根據(jù)表中的數(shù)據(jù),得到銷量y(單位:件)與單價x(單位:元)之間的經(jīng)驗回歸方程為,據(jù)計算,樣本點處的殘差為1,則(????).
A.76 B.75 C.74 D.73
【答案】B
【分析】利用樣本點處的殘差為1,求得250,再由,求得,進而可得答案.
【詳解】由條件知當(dāng)時,,
代入,解得,于是,
又,所以,即,解得,
故選:B.
23.(2023春·湖南長沙·高二長郡中學(xué)??茧A段練習(xí))有如下四個命題:
①甲乙兩組數(shù)據(jù)分別為甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.則甲乙的中位數(shù)分別為45和44.
②相關(guān)系數(shù),表明兩個變量的相關(guān)性較弱.
③若由一個列聯(lián)表中的數(shù)據(jù)計算得的觀測值約為4.103,則認(rèn)為兩個變量有關(guān),此推斷犯錯誤的概率不超過0.05.
④用最小二乘法求出一組數(shù)據(jù)的回歸直線方程后要進行殘差分析,相應(yīng)數(shù)據(jù)的殘差是指.
以上命題錯誤的序號是__________.
【答案】②
【分析】求出兩組數(shù)據(jù)的中位數(shù)判斷①;利用相關(guān)系數(shù)的意義判斷②;利用的觀測值與要求的臨界值對判斷③;利用殘差的意義判斷④作答.
【詳解】對于①,甲組數(shù)據(jù)的中位數(shù)為45,乙組數(shù)據(jù)的中位數(shù)為,①正確;
對于②,相關(guān)系數(shù)時,兩個變量有很強的相關(guān)性,②錯誤;
對于③,的觀測值約為,認(rèn)為兩個變量有關(guān),此推斷犯錯誤的概率不超過0.05,③正確;
對于④,殘差分析中,相應(yīng)數(shù)據(jù)的殘差,④正確,
所以命題錯誤的序號是②.
故答案為:②
24.【多選】(2023春·江西南昌·高二??茧A段練習(xí))2022年4月15日,因疫情原因,市物價部門對5家商場的某商品一天的線上銷售量及其價格進行調(diào)查,5家商場的售價x(元)和銷售量y(件)之間的一組數(shù)據(jù)如表所示:
價格x
9
9.5
10
10.5
11
銷售量y
11
10
8
6
5
按公式計算,y與x的回歸直線方程是:,相關(guān)系數(shù),則下列說法正確的是(????)
A. B.變量x,y線性負(fù)相關(guān)且相關(guān)性較強
C.相應(yīng)于點(9.5,10)的殘差約為-0.4 D.當(dāng)x=8時,y的估計值為14.4
【答案】ABD
【分析】對選項A由樣本中心在回歸方程上求參數(shù);對選項B由相關(guān)系數(shù)的意義及回歸方程的斜率符號判斷;對選項C利用殘差的定義求殘差;對選項D將8代入回歸方程求估計值.
【詳解】由表格知:,
所以,可得,A正確;
由相關(guān)系數(shù)且回歸方程斜率為負(fù),則變量線性負(fù)相關(guān)且相關(guān)性較強,B正確;
由,故殘差為,C錯誤;
由,D正確;
故選:ABD
25.(2023·云南昆明·高三昆明一中校考階段練習(xí))小王經(jīng)營了一家小型餐館,自去年疫情管控宣布結(jié)束后的第1天開始,經(jīng)營狀況逐步有了好轉(zhuǎn),該店第一周的營業(yè)收入數(shù)據(jù)(單位:百元)統(tǒng)計如下:
天數(shù)序號x
1
2
3
4
5
6
7
營業(yè)收入y
11
13
18
※
28
※
35
其中第4天和第6天的數(shù)據(jù)由于某種原因造成模糊,但知道7天的營業(yè)收入平均值是23,已知營業(yè)收入y與天數(shù)序號x可以用經(jīng)驗回歸直線方程擬合,且第7天的殘差是,則的值是(????)
A.10.4 B.6.2 C.4.2 D.2
【答案】A
【分析】根據(jù)殘差的定義求出,結(jié)合樣本中心點滿足回歸方程,列方程組求出,,由此可得結(jié)論.
【詳解】由殘差得,即,
所以①,
又,,因為回歸直線經(jīng)過中心點,
所以②,
聯(lián)立①②解得,,
所以,
故選:A.
26.【多選】(2023春·湖南張家界·高二慈利縣第一中學(xué)??计谥校哂邢嚓P(guān)關(guān)系的兩個變量x和y進行回歸分析時,經(jīng)過隨機抽樣獲得成對的樣本點數(shù)據(jù),則下列結(jié)論正確的是(??????)
A.若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線至少經(jīng)過一個樣本點
B.若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線一定經(jīng)過樣本點中心
C.若以模型擬合該組數(shù)據(jù),為了求出回歸方程,設(shè),將其變換后得到線性方程,則a,h的估計值分別是3和6
D.回歸分析中常用殘差平方和來刻畫擬合效果好壞,殘差平方和越小,擬合效果越好
【答案】BCD
【分析】根據(jù)回歸方程的性質(zhì)判斷A,B,比較列方程確定a,h的估計值判斷C,根據(jù)殘差和的意義判斷D.
【詳解】對于A,若兩變量x,y具有線性相關(guān)關(guān)系,則所有樣本點都可能不在回歸直線上,A錯誤;
對于B,若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線一定經(jīng)過樣本點中心,B正確;
對于C,因為,所以,即,又,所以a,h的估計值分別是3和6,C正確;
對于D,殘差平方和越小,擬合效果越好,D正確;
故選:BCD.
(二) 求相關(guān)指數(shù)
27.(2023春·四川成都·高二統(tǒng)考期中)某種農(nóng)作物可以生長在灘涂和鹽堿地,它的灌溉是將海水稀釋后進行灌溉.某實驗基地為了研究海水濃度(%)對畝產(chǎn)量(噸)的影響,通過在試驗田的種植實驗,測得了該農(nóng)作物的畝產(chǎn)量與海水濃度的數(shù)據(jù)如下表.
海水濃度(%)
3
4
5
6
7
畝產(chǎn)量(噸)
0.57
0.53
0.44
0.36
0.30
殘差
-0.01
0.02
m
n
0
繪制散點圖發(fā)現(xiàn),可以用線性回歸模型擬合畝產(chǎn)量(噸)與海水濃度(%)之間的相關(guān)關(guān)系,用最小二乘法計算得與之間的線性回歸方程為.
(1)求的值;(參考公式:)
(2)統(tǒng)計學(xué)中常用相關(guān)指數(shù)來刻畫回歸效果,越大,回歸效果越好,如假設(shè),就說明預(yù)報變量的差異有是解釋變量引起的.請計算相關(guān)指數(shù)(精確到0.01),并指出畝產(chǎn)量的變化多大程度上是由灌溉海水濃度引起的?
附殘差相關(guān)指數(shù)其中
【答案】(1)0;-0.01
(2)0.99,畝產(chǎn)量的變化有是由灌溉海水濃度引起的.
【分析】(1)計算代入回歸方程可得,利用殘差求解方法可得的值;
(2)利用相關(guān)指數(shù)的公式求解出相關(guān)指數(shù)的值,結(jié)合結(jié)果可得判斷.
【詳解】(1)因為,???????????????
所以,即,
所以線性回歸方程為,?????????????
所以,
.??????????????????????????
,
.
(2),
所以相關(guān)指數(shù).
故畝產(chǎn)量的變化有是由灌溉海水濃度引起的.
28.(2023·黑龍江哈爾濱·哈爾濱三中??级#┲袊伯a(chǎn)黨第二十次全國代表大會上的報告中提到,新時代十年我國經(jīng)濟實力實現(xiàn)歷史性躍升,國內(nèi)生產(chǎn)總值從54萬億元增長到114萬億元,我國經(jīng)濟總量穩(wěn)居世界第二位.建立年份編號為解釋變量,地區(qū)生產(chǎn)總值為響應(yīng)變量的一元線性回歸模型,現(xiàn)就2012-2016某市的地區(qū)生產(chǎn)總值統(tǒng)計如下:
年份
2012
2013
2014
2015
2016
年份編號
1
2
3
4
5
地區(qū)生產(chǎn)總值(億元)
2.8
3.1
3.9
4.6
5.6
(1)求出回歸方程,并計算2016年地區(qū)生產(chǎn)總值的殘差;
(2)隨著我國打贏了人類歷史上規(guī)模最大的脫貧攻堅戰(zhàn),該市2017-2022的地區(qū)生產(chǎn)總值持續(xù)增長,現(xiàn)對這11年的數(shù)據(jù)有三種經(jīng)驗回歸模型、、,它們的分別為0.976、0.880和0.985,請根據(jù)的數(shù)值選擇最好的回歸模型預(yù)測一下2023年該市的地區(qū)生產(chǎn)總值;
(3)若2012-2022該市的人口數(shù)(單位:百萬)與年份編號的回歸模型為,結(jié)合(2)問中的最佳模型,預(yù)測一下在2023年以后,該市人均地區(qū)生產(chǎn)總值的變化趨勢.
參考公式:,;
【答案】(1),殘差為
(2)選用更好,17.773億元
(3)逐年遞增
【分析】(1)應(yīng)用最小二乘法求回歸直線方程即可;
(2)由相關(guān)指數(shù)的大小,結(jié)合其的實際意義確定較好模型,進而估計2023年該市的地區(qū)生產(chǎn)總值;
(3)由題設(shè)可得該市人均地區(qū)生產(chǎn)總值,利用單調(diào)性定義判斷其在上的單調(diào)性即可.
【詳解】(1)由數(shù)據(jù),,,
而,,
所以,則,
綜上,回歸方程為,
當(dāng)時,,故2016年地區(qū)生產(chǎn)總值殘差為.
(2)根據(jù)相關(guān)指數(shù)越大擬合越好,由于,故模型較好,
因2023年對應(yīng),則億元.
(3)由(2)及題設(shè)知:該市人均地區(qū)生產(chǎn)總值,
令,且,若,
所以,
而且,則,故,
所以在上遞增,則在上遞增,
所以該市人均地區(qū)生產(chǎn)總值逐年遞增.
29.(2023春·四川成都·高二??茧A段練習(xí))某市春節(jié)期間家超市的廣告費用支出(萬元)和銷售額(萬元)數(shù)據(jù)如下表:
超市
廣告費支出
銷售額
(1)若用線性回歸模型擬合與的關(guān)系,求關(guān)于的線性回歸方程;提示:,,,
(2)用二次函數(shù)回歸模型擬合與的關(guān)系,可得回歸方程,經(jīng)過計算二次函數(shù)回歸模型和線性回歸模型的相關(guān)指數(shù)分別約為和,請用說明選擇哪個回歸模型更合適,并用此模型預(yù)測超市廣告費用支出萬元時的銷售額.
【答案】(1)
(2)二次函數(shù)模型更合適,超市廣告費用支出萬元時的銷售額為萬元
【分析】(1)根據(jù)表格數(shù)據(jù),利用最小二乘法求解;
(2)根據(jù)相關(guān)指數(shù)得到二次函數(shù)模型更合適,然后將代入二次函數(shù)模型求解.
【詳解】(1)解:由表格數(shù)據(jù)知:,
,
,
,
設(shè)關(guān)于的線性回歸方程為:,
,,
關(guān)于的線性回歸方程為.
(2),
二次函數(shù)模型更合適,
將代入得:,
即超市廣告費用支出萬元時的銷售額為萬元.
30.(2023春·黑龍江哈爾濱·高二哈九中校考階段練習(xí))某果園種植“糖心蘋果”已有十余年,為了提高利潤,該果園每年投入一定的資金,對種植?采摘?包裝?宣傳等環(huán)節(jié)進行改進.如圖是2013年至2022年,該果園每年的投資金額(單位:萬元)與年利潤增量(單位:萬元)的散點圖:
該果園為了預(yù)測2023年投資金額為20萬元時的年利潤增量,建立了關(guān)于的兩個回歸模型;
模型①:由最小二乘公式可求得與的線性回歸方程:;
模型②:由圖中樣本點的分布,可以認(rèn)為樣本點集中在曲線:的附近,對投資金額做交換,令,則,且有,,,.
(1)根據(jù)所給的統(tǒng)計量,求模型②中關(guān)于的回歸方程;
(2)根據(jù)下列表格中的數(shù)據(jù),比較兩種模型的相關(guān)指數(shù),并選擇擬合精度更高、更可靠的模型,預(yù)測投資金額為20萬元時的年利潤增量(結(jié)果保留兩位小數(shù)).
回歸模型
模型①
模型②
回歸方程
102.28
36.19
附:,;
相關(guān)指數(shù).
參考數(shù)據(jù):,.
【答案】(1);
(2)模型①的小于模型②,選擇模型②;(萬元).
【分析】(1)根據(jù)已知條件,結(jié)合最小二乘法和線性回歸方程的公式,計算即可;
(2)根據(jù)已知條件,結(jié)合相關(guān)系數(shù)公式,即可得兩模型的相關(guān)指數(shù)的大小,并選擇擬合效果好的模型,再將,代入計算即可得答案.
【詳解】(1)解:由,,得,
所以 ,
,
所以,模型②中,關(guān)于的回歸方程為;
(2)解:由表中的數(shù)據(jù),有,
則,
所以模型①的小于模型②,說明回歸模型②刻畫的擬合效果更好;
當(dāng)時,模型②的年利潤增量的預(yù)測值為:(萬元).
考點五 非線性回歸
解題方略:
非線性回歸問題的處理方法
(1)指數(shù)函數(shù)型y=ebx+a
①函數(shù)y=ebx+a的圖象,如圖所示;
②處理方法:兩邊取對數(shù)得ln y=ln ebx+a,即ln y=bx+a.令z=ln y,把原始數(shù)據(jù)(x,y)轉(zhuǎn)化為(x,z),再根據(jù)線性回歸模型的方法求出a,b.
(2)對數(shù)函數(shù)型y=bln x+a
①函數(shù)y=bln x+a的圖象,如圖所示;
②處理方法:設(shè)x′=ln x,原方程可化為y=bx′+a,
再根據(jù)線性回歸模型的方法求出a,b.
(3)y=bx2+a型
處理方法:設(shè)x′=x2,原方程可化為y=bx′+a,再根據(jù)線性回歸模型的方法求出a,b.
31.(2023·寧夏中衛(wèi)·統(tǒng)考二模)區(qū)塊鏈技術(shù)被認(rèn)為是繼蒸汽機、電力、互聯(lián)網(wǎng)之后,下一代顛覆性的核心技術(shù).區(qū)塊鏈作為構(gòu)造信任的機器,將可能徹底改變整個人類社會價值傳遞的方式,2018年至2022年五年期間,中國的區(qū)塊鏈企業(yè)數(shù)量逐年增長,居世界前列.現(xiàn)收集我國近5年區(qū)塊鏈企業(yè)總數(shù)量相關(guān)數(shù)據(jù),如表:
年份
2018
2019
2020
2021
2022
編號x
1
2
3
4
5
企業(yè)總數(shù)量y(單位:千個)
2.156
3.727
8.305
24.279
36.224
(1)根據(jù)表中數(shù)據(jù)判斷,與(其中e=2.71828…為自然對數(shù)的底數(shù)),哪一個回歸方程類型適宜預(yù)測未來幾年我國區(qū)塊鏈企業(yè)總數(shù)量?(給出結(jié)果即可,不必說明理由)
(2)根據(jù)(1)的結(jié)果,求關(guān)于的回歸方程;(結(jié)果精確到小數(shù)點后第三位)
附:線性回歸方程中,,
參考數(shù)據(jù):,,,
(3)為了促進公司間的合作與發(fā)展,區(qū)塊鏈聯(lián)合總部決定進行一次信息化技術(shù)比賽,邀請甲、乙、丙三家區(qū)塊鏈公司參賽,比賽規(guī)則如下:①每場比賽有兩個公司參加,并決出勝負(fù);②每場比賽獲勝的公司與未參加此場比賽的公司進行下一場的比賽;③在比賽中,若有一個公司首先獲勝兩場,則本次比賽結(jié)束,該公司就獲得此次信息化比賽的“優(yōu)勝公司”.已知在每場比賽中,甲勝乙的概率為,甲勝丙的概率為,乙勝丙的概率為,請通過計算說明,哪兩個公司進行首場比賽時,甲公司獲得“優(yōu)勝公司”的概率最大?
【答案】(1)適宜
(2)
(3)甲公司獲得“優(yōu)勝公司”的概率最大
【分析】(1)根據(jù)增加速度逐漸變快即可得解;
(2)對兩邊取自然對數(shù),得,轉(zhuǎn)化為線性相關(guān),再利用最小二乘法求出線性回歸方程,再轉(zhuǎn)化為關(guān)于的回歸方程即可;
(3)對于首場比賽的選擇分A:甲與乙先賽;B:甲與丙先賽;C:丙與乙先賽,三種情況討論,分別求出對應(yīng)概率,即可得出結(jié)論.
【詳解】(1)根據(jù)表中數(shù)據(jù)可知增加的速度逐漸變快,
所以回歸方程適宜預(yù)測未來幾年我國區(qū)塊鏈企業(yè)總數(shù)量;
(2)對兩邊取自然對數(shù),得,
令,得,
由于,,,
則,
,
∴關(guān)于的回歸直線方程為,
則關(guān)于的回歸方程為;
(3)對于首場比賽的選擇有以下三種情況:
A:甲與乙先賽;B:甲與丙先賽;C:丙與乙先賽,
由于在每場比賽中,甲勝乙的概率為,甲勝丙的概率為,乙勝丙的概率為,
則甲公司獲勝的概率分別是
,
,
,
由于,
∴甲與丙兩公司進行首場比賽時,甲公司獲得“優(yōu)勝公司”的概率最大.
32.(2023春·內(nèi)蒙古赤峰·高二赤峰二中??茧A段練習(xí))某新能源汽車公司從2018年到2022年汽車年銷售量y(單位:萬輛)的散點圖如下:
記年份代碼為
(1)根據(jù)散點圖判斷,模型①與模型②,哪一個更適宜作為年銷售量y關(guān)于年份代碼x的回歸方程?(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果,建立y關(guān)于x的回歸方程.
參考數(shù)據(jù):
34
55
979
657
2805
,
【答案】(1)
(2)
【分析】(1)根據(jù)散點圖及一次函數(shù)與二次函數(shù)特點得出結(jié)論;
(2)令,換元后轉(zhuǎn)化為關(guān)于的線性回歸方程,根據(jù)公式求出系數(shù),得出回歸直線方程,再換回即可.
【詳解】(1)由散點圖可知:散點圖與一次函數(shù)偏差較大,與二次函數(shù)較接近,故模型②更適合.
(2)由(1)可設(shè)回歸方程為,
令,則回歸方程.
因為,,
,,
,
,
故回歸方程為,
即.
33.(2023·福建·統(tǒng)考模擬預(yù)測)放行準(zhǔn)點率是衡量機場運行效率和服務(wù)質(zhì)量的重要指標(biāo)之一.某機場自2012年起采取相關(guān)策略優(yōu)化各個服務(wù)環(huán)節(jié),運行效率不斷提升.以下是根據(jù)近10年年份數(shù)與該機場飛往A地航班放行準(zhǔn)點率()(單位:百分比)的統(tǒng)計數(shù)據(jù)所作的散點圖及經(jīng)過初步處理后得到的一些統(tǒng)計量的值.
2017.5
80.4
1.5
40703145.0
1621254.2
27.7
1226.8
其中,
(1)根據(jù)散點圖判斷,與哪一個適宜作為該機場飛往A地航班放行準(zhǔn)點率y關(guān)于年份數(shù)x的經(jīng)驗回歸方程類型(給出判斷即可,不必說明理由),并根據(jù)表中數(shù)據(jù)建立經(jīng)驗回歸方程,由此預(yù)測2023年該機場飛往A地的航班放行準(zhǔn)點率.
(2)已知2023年該機場飛往A地?B地和其他地區(qū)的航班比例分別為0.2、0.2和0.6.若以(1)中的預(yù)測值作為2023年該機場飛往A地航班放行準(zhǔn)點率的估計值,且2023年該機場飛往B地及其他地區(qū)(不包含A、B兩地)航班放行準(zhǔn)點率的估計值分別為和,試解決以下問題:
(i)現(xiàn)從2023年在該機場起飛的航班中隨機抽取一個,求該航班準(zhǔn)點放行的概率;
(ii)若2023年某航班在該機場準(zhǔn)點放行,判斷該航班飛往A地、B地、其他地區(qū)等三種情況中的哪種情況的可能性最大,說明你的理由.
附:(1)對于一組數(shù)據(jù),,…,,其回歸直線的斜率和截距的最小二乘估計分別為,
參考數(shù)據(jù):,,.
【答案】(1)適宜,預(yù)測2023年該機場飛往A地的航班放行準(zhǔn)點率
(2)(i)0.778;(ii)可判斷該航班飛往其他地區(qū)的可能性最大,理由見解析
【分析】(1)根據(jù)線性回歸方程的計算公式,選擇合適的模型計算即可;
(2)利用全概率公式和條件概率公式,即可根據(jù)概率判斷可能性最大的情況.
【詳解】(1)由散點圖判斷適宜作為該機場飛往A地航班放行準(zhǔn)點率y關(guān)于年份數(shù)x的經(jīng)驗回歸方程類型.
令,先建立y關(guān)于t的線性回歸方程.
由于,
,
該機場飛往A地航班放行準(zhǔn)點率y關(guān)于t的線性回歸方程為,
因此y關(guān)于年份數(shù)x的回歸方程為
所以當(dāng)時,該機場飛往A地航班放行準(zhǔn)點率y的預(yù)報值為
.
所以2023年該機場飛往A地航班放行準(zhǔn)點率y的預(yù)報值為.
(2)設(shè) “該航班飛往A地”, “該航班飛往B地”, “該航班飛往其他地區(qū)”,“該航班準(zhǔn)點放行”,
則,,,
,,.
(i)由全概率公式得,
,
所以該航班準(zhǔn)點放行的概率為0.778.
(ii),
,
,
因為,
所以可判斷該航班飛往其他地區(qū)的可能性最大.
34.(2023·云南昆明·高三昆明一中??茧A段練習(xí))《中共中央國務(wù)院關(guān)于全面推進鄉(xiāng)村振興加快農(nóng)業(yè)農(nóng)村現(xiàn)代化的意見》,這是21世紀(jì)以來第18個指導(dǎo)“三農(nóng)”工作的中央一號文件.文件指出,民族要復(fù)興,鄉(xiāng)村必振興,要大力推進數(shù)字鄉(xiāng)村建設(shè),推進智慧農(nóng)業(yè)發(fā)展.某鄉(xiāng)村合作社借助互聯(lián)網(wǎng)直播平臺進行農(nóng)產(chǎn)品銷售,眾多網(wǎng)紅主播參與到直播當(dāng)中,在眾多網(wǎng)紅直播中,統(tǒng)計了10名網(wǎng)紅直播的觀看人次和農(nóng)產(chǎn)品銷售量的數(shù)據(jù),得到如圖所示的散點圖.
(1)利用散點圖判斷,和哪一個更適合作為觀看人次x和銷售量y的回歸方程類型;(只要給出判斷即可,不必說明理由)
(2)對數(shù)據(jù)作出如下處理:得到相關(guān)統(tǒng)計量的值如表:
9.4
30.3
2
366
6.6
439.2
66
其中令,.根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),求y關(guān)于x的回歸方程,并預(yù)測當(dāng)觀看人次為280萬人時的銷售量;
(3)規(guī)定:觀看人次大于等于120萬人次的主播為優(yōu)秀主播,從這10名主播中隨機抽取3名,記其中優(yōu)秀主播的人數(shù)為,求的分布列和數(shù)學(xué)期望.
參考數(shù)據(jù)和公式:,
附:對于一組數(shù)據(jù),,…,,其回歸線的斜率和截距的最小二乘估計分別為:,.
【答案】(1)更適合
(2),43600件
(3)分布列見解析,
【分析】(1)觀察散點圖,根據(jù)散點的分布規(guī)律判斷應(yīng)采用的模型;
(2)令,先求y與的線性回歸方程,由此可得y與的回歸方程,再利用回歸方程預(yù)測;
(3)確定隨機變量的的可能取值,再求取各值的概率,由此可得的分布列,利用均值公式求其期望.
【詳解】(1)由散點圖可知,散點分布在一條對數(shù)型曲線附近,
所以選擇回歸方程更適合;
(2)令,則,
因為,,
所以,
又,,
所以,
所以y與的線性回歸方程為,
故y關(guān)于x的回歸方程為.
令,代入回歸方程可得(千件),
所以預(yù)測觀看人次為280萬人時的銷售量約為43600件.
(3)由散點圖可知,這10名主播中,優(yōu)秀主播的個數(shù)有4個,
所以X的可能取值為0,1,2,3,
所以,,
,,
所以X的分布列為:
X
0
1
2
3
P
數(shù)學(xué)期望.
35.(2023·山西·校聯(lián)考模擬預(yù)測)某劇場的座位數(shù)量是固定的,管理人員統(tǒng)計了最近在該劇場舉辦的五場表演的票價(單位:元)和上座率(上座人數(shù)與總座位數(shù)的比值)的數(shù)據(jù),其中,并根據(jù)統(tǒng)計數(shù)據(jù)得到如下的散點圖:
(1)由散點圖判斷與哪個模型能更好地對與的關(guān)系進行擬合(給出判斷即可,不必說明理由),并根據(jù)你的判斷結(jié)果求回歸方程;
(2)根據(jù)(1)所求的回歸方程,預(yù)測票價為多少時,劇場的門票收入最多.
參考數(shù)據(jù):,,;設(shè),則,,;,,.
參考公式:對于一組數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計分別為:,.
【答案】(1)能更好地對y與x的關(guān)系進行擬合,;
(2)預(yù)測票價為元時,劇場的門票收入最多.
【分析】(1)由散點圖知,能更好地對與的關(guān)系進行擬合,設(shè),由公式求出,再將代入求出,可得關(guān)于的線性回歸方程,進而得出關(guān)于的回歸方程;
(2)設(shè)函數(shù),對函數(shù)求導(dǎo),判斷出單調(diào)性和極值,可預(yù)測劇場的門票收入最多時的票價.
【詳解】(1)能更好地對與的關(guān)系進行擬合.???????????????????????????????
設(shè),先求關(guān)于的線性回歸方程.
由已知得,
所以,
,
所以關(guān)于的線性回歸方程為,
所以關(guān)于的回歸方程為;
(2)設(shè)該劇場的總座位數(shù)為,由題意得門票收入為,
設(shè)函數(shù),則,
當(dāng),即時,函數(shù)單調(diào)遞減,當(dāng),即時,函數(shù)單調(diào)遞增,
所以在處取最大值,?????????????????????????????????????????
所以預(yù)測票價為元時,劇場的門票收入最多.
36.(2023·全國·模擬預(yù)測)某鄉(xiāng)鎮(zhèn)全面實施鄉(xiāng)村振興,大力發(fā)展特色產(chǎn)業(yè)——富硒水果.工作人員統(tǒng)計了近8年富硒水果種植面積(單位:百畝)與年銷售額(單位:千萬元)的數(shù)據(jù).經(jīng)計算得到如下處理后的統(tǒng)計量:,,,,,,,,,其中,.
(1)根據(jù)以上數(shù)據(jù),從相關(guān)系數(shù)的角度,判斷與哪個適宜作為年銷售額關(guān)于種植面積的回歸方程類型(相關(guān)系數(shù)精確到0.01).
(2)根據(jù)(1)的判斷結(jié)果及相關(guān)數(shù)據(jù),建立關(guān)于的回歸方程(系數(shù)精確到0.01).
(3)該鄉(xiāng)鎮(zhèn)計劃年銷售額不低于10億元,請預(yù)測種植面積至少為多少畝.
附:相關(guān)系數(shù),回歸直線的斜率與截距的最小二乘估計分別為,.
參考數(shù)據(jù):,.
【答案】(1)適宜作為年銷售額關(guān)于種植面積的回歸方程類型
(2)
(3)706畝
【分析】(1)根據(jù)已知條件與相關(guān)系數(shù)公式求出相關(guān)系數(shù),的值,然后根據(jù),的絕對值的大小,可知適宜作為年銷售額關(guān)于種植面積的回歸方程類型;
(2)通過公式求出回歸系數(shù),的值,從而可求出回歸方程;
(3)把已知數(shù)據(jù)代入回歸方程,即可求出預(yù)測值.
【詳解】(1)若用作為年銷售額關(guān)于種植面積的回歸方程類型,則設(shè),則.
設(shè)與的相關(guān)系數(shù)為,則.
由,,得,
則,所以.
若用作為年銷售額關(guān)于種植面積的回歸方程類型,則.
設(shè),則.
設(shè)與的相關(guān)系數(shù)為,則
.
因為,所以適宜作為年銷售額關(guān)于種植面積的回歸方程類型.
(2).
由,得.
,
所以關(guān)于的線性方程為,則關(guān)于的回歸方程為.
(3)由題意可知.整理,得,
因為,
解得或(舍去),
故種植面積至少為706畝.
37.(2023·全國·模擬預(yù)測)信創(chuàng)產(chǎn)業(yè)即信息技術(shù)應(yīng)用創(chuàng)新產(chǎn)業(yè),是一條規(guī)模龐大、體系完整的產(chǎn)業(yè)鏈,是數(shù)字經(jīng)濟的重要抓手之一.在政府、企業(yè)等多方面的共同努力下,中國信創(chuàng)產(chǎn)業(yè)市場規(guī)模不斷擴大,市場釋放出前所未有的活力.下表為2018—2022年中國信創(chuàng)產(chǎn)業(yè)規(guī)模(單位:千億元),其中2018—2022年對應(yīng)的代碼依次為1~5.
年份代碼x
1
2
3
4
5
中國信創(chuàng)產(chǎn)業(yè)規(guī)模y/千億元
8.1
9.6
11.5
13.8
16.7
(1)從2018—2022年中國信創(chuàng)產(chǎn)業(yè)規(guī)模中任取2個數(shù)據(jù),求這2個數(shù)據(jù)都大于10的概率.
(2)由上表數(shù)據(jù)可知,可用指數(shù)型函數(shù)模型擬合y與x的關(guān)系,請建立y關(guān)于x的回歸方程(a,b的值精確到0.01),并預(yù)測2023年中國信創(chuàng)產(chǎn)業(yè)規(guī)模能否超過20千億元.
參考數(shù)據(jù):
2.45
38.52
6.81
1.19
2.84
其中,.
參考公式:對于一組數(shù)據(jù),,…,,其回歸直線的斜率和截距的最小二乘估計公式分別為,.
【答案】(1)
(2),不會超過20千億元.
【分析】(1)根據(jù)古典概型概率計算公式,利用列舉法可得2個數(shù)據(jù)都大于10的概率為;(2)將指數(shù)型函數(shù)模型兩邊取對數(shù)可得,即,再利用參考數(shù)據(jù)可得回歸方程為,將2023年的年份代碼6代入可得,即可得出結(jié)論.
【詳解】(1)從2018—2022年中國信創(chuàng)產(chǎn)業(yè)規(guī)模中任取2個數(shù)據(jù)有
,,,,,,
,,,,共10種情況.
其中這2個數(shù)據(jù)都大于10的有,,,共3種情況,
所以2個數(shù)據(jù)都大于10的概率.
(2)兩邊同時取自然對數(shù),
得,則.
因為,,,
所以,
,所以,
即,所以,
即y關(guān)于x的回歸方程為.
2023年的年份代碼為6,把代入,
得,
所以預(yù)測2023年中國信創(chuàng)產(chǎn)業(yè)規(guī)模不會超過20千億元.
題組A 基礎(chǔ)過關(guān)練
1.(2023春·遼寧·高二校聯(lián)考階段練習(xí))某種產(chǎn)品的廣告費用(單位:萬元)與銷售額(單位:萬元)之間的關(guān)系如下表:
1
3
4
5
7
6
8
12
10
14
若與的回歸直線方程為,則(????)
A.4.1 B.4.7 C.4.8 D.6.8
【答案】C
【分析】根據(jù)表格的數(shù)據(jù)求得樣本中心為,代入回歸直線方程,即可求解.
【詳解】根據(jù)表格中的數(shù)據(jù),可得,,
即樣本中心為,代入回歸直線方程,即,
解得.
故選:C.
2.(2023春·四川成都·高二統(tǒng)考期中)某校一個課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率和溫度(單位:)的關(guān)系,在個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)得到下面的散點圖:
由此散點圖,在至之間,下面四個回歸方程類型中最適宜作為發(fā)芽率和溫度的回歸方程類型的是(????)
A. B.
C. D.
【答案】D
【分析】根據(jù)散點的分布可得出合適的回歸方程類型.
【詳解】由散點圖可見,數(shù)據(jù)分布成遞增趨勢,但是呈現(xiàn)上凸效果,即增加緩慢.
A中,是直線型,均勻增長,不符合要求;
B中,是二次函數(shù)型,函數(shù)對稱軸為軸,
當(dāng)時,圖象呈現(xiàn)下凸,增長也較快,不符合要求;
當(dāng)時,圖象呈現(xiàn)上凸,呈遞減趨勢,不符合要求;
C中,是指數(shù)型,爆炸式增長,增長快,不符合要求;
D中,是對數(shù)型,增長緩慢,符合要求.
故對數(shù)型最適宜該回歸模型.
故選:D.
3.(2023春·江西·高二江西師大附中??茧A段練習(xí))經(jīng)統(tǒng)計,用于數(shù)學(xué)學(xué)習(xí)的時間(單位:小時)與成績(單位:分)近似于線性相關(guān)關(guān)系.對某小組學(xué)生每周用于數(shù)學(xué)的學(xué)習(xí)時間與數(shù)學(xué)成績進行數(shù)據(jù)收集如下:
15
16
18
19
22
102
98
115
115
120
由表中樣本數(shù)據(jù)求得回歸方程為,則點與直線的位置關(guān)系是(????)
A.點在直線左側(cè) B.點在直線右側(cè)
C.點在直線上 D.無法確定
【答案】C
【分析】計算平均數(shù),根據(jù)回歸方程過樣本中心點,然后根據(jù)直線方程即得.
【詳解】由題得,,
代入回歸方程得,
∴點在直線上.
故選:C
4.(2023·上海松江·統(tǒng)考二模)為了解某社區(qū)居民的家庭年收入與年支出的關(guān)系,隨機調(diào)查了該社區(qū)5戶家庭,得到如下統(tǒng)計數(shù)據(jù)表:
收入x(萬元)
8.2
8.6
10.0
11.3
11.9
支出y(萬元)
6.2
7.5
8.0
8.5
9.8
根據(jù)上表可得回歸直線方程,其中,,據(jù)此估計,該社區(qū)一戶收入為15萬元家庭年支出為(????)
A.11.4萬元 B.11.8萬元 C.12.0萬元 D.12.2萬元
【答案】B
【分析】求出,,則求出,最后得到回歸直線方程,代入即可.
【詳解】由題意得,,
,則,
所以,當(dāng)時,,
故選:B.
5.(2023春·四川成都·高二樹德中學(xué)校考階段練習(xí))已知呈線性相關(guān)的變量與的部分?jǐn)?shù)據(jù)如表所示:若其回歸直線方程是,則______.
2
4
5
6
8
3
4.5
7.5
9
【答案】6.5/
【分析】根據(jù)樣本中心點一定在回歸直線上,代入求解即可.
【詳解】
樣本點的中心的坐標(biāo)為
代入得:解得:
故答案為:6.5
6.(2023·高二課時練習(xí))根據(jù)如下樣本數(shù)據(jù),得到的線性回歸方程為,則(????)
x
2
3
4
5
6
y
4
2.5
A., B., C., D.,
【答案】B
【分析】根據(jù)表格分析數(shù)據(jù)即可得出.
【詳解】解:由表格可以得出隨增大而減小,故,
又
故過點,代入可得.
故選:B.
7.(2023春·湖北·高三校聯(lián)考階段練習(xí))如圖是近十年來全國城鎮(zhèn)人口?鄉(xiāng)村人口隨年份變化的折線圖(數(shù)據(jù)來自國家統(tǒng)計局).根據(jù)該折線圖判斷近十年的情況,下列說法錯誤的是(????)
A.城鎮(zhèn)人口與年份成正相關(guān)
B.鄉(xiāng)村人口與年份的樣本相關(guān)系數(shù)接近1
C.城鎮(zhèn)人口逐年增長量大致相同
D.可預(yù)測鄉(xiāng)村人口仍呈下降趨勢
【答案】B
【分析】根據(jù)折線圖可分析城鎮(zhèn)人口與年份的關(guān)系可判斷A,根據(jù)相關(guān)系數(shù)的概念可判斷B,根據(jù)折線圖趨勢可判斷C,D.
【詳解】對于A選項,由折線圖可知,城鎮(zhèn)人口與年份成正相關(guān),A正確;
對于B選項,因為鄉(xiāng)村人口與年份成負(fù)線性相關(guān)關(guān)系,且線性相關(guān)性很強,
所以接近B錯誤;
對于C選項,城鎮(zhèn)人口與年份成正相關(guān),且線性相關(guān)性很強,
設(shè)線性經(jīng)驗回歸方程為,
當(dāng)時,,
故城鎮(zhèn)人口逐年增長量大致相同,C正確;
對于D選項,鄉(xiāng)村人口與年份成負(fù)線性相關(guān)關(guān)系,
可預(yù)測鄉(xiāng)村人口仍呈現(xiàn)下降趨勢,D正確.
故選:B.
8.(2023·高二課時練習(xí))已知變量y與x之間具有線性相關(guān)關(guān)系,根據(jù)變量x與y的相關(guān)數(shù)據(jù),計算得則y關(guān)于x的線性回歸方程為(????)
附:回歸方程中的斜率和截距的最小二乘法估計公式分別為
A. B.
C. D.
【答案】B
【分析】根據(jù)已知數(shù)據(jù)求,代入回歸直線方程即可求解.
【詳解】由題中的數(shù)據(jù)可知,
所以.
所以.
所以y關(guān)于x的線性回歸方程為.
故選:B.
9.(2023·高二課時練習(xí))以模型去擬合一組數(shù)據(jù)時,為了求出回歸方程,設(shè),將其變換后得到經(jīng)驗回歸方程,則的值分別是(????)
A. B. C. D.
【答案】B
【分析】模型兩邊取對數(shù),又,可得,又已知回歸方程,可求的值.
【詳解】由題意得,設(shè),可得.
又經(jīng)驗回歸方程為,
所以,故.
故選:B
題組B 能力提升練
10.【多選】(2023春·湖南邵陽·高二邵陽市第二中學(xué)??计谥校┮韵抡f法正確的是(????)
A.89,90,91,92,93,94,95,96,97的第75百分位數(shù)為95
B.具有相關(guān)關(guān)系的兩個變量x,y的一組觀測數(shù)據(jù),,,,由此得到的線性回歸方程為,回歸直線至少經(jīng)過點,,,中的一個點
C.相關(guān)系數(shù)r的絕對值越接近于1,兩個隨機變量的線性相關(guān)性越強
D.已知隨機事件A,B滿足,,且,則事件A與B不互斥
【答案】ACD
【分析】對于A選項:結(jié)合百分位數(shù)的定義即可求解;
對于B選項:結(jié)合經(jīng)驗回歸方程的性質(zhì)即可求解;
對于C選項:根據(jù)相關(guān)系數(shù)的性質(zhì)即可判斷;
對于D選項:根據(jù)互斥事件的定義和事件的相互獨立性即可求解.
【詳解】對于A選項:從小到大排列共有9個數(shù)據(jù),則不是整數(shù),則第75百分位數(shù)為從小到大排列的第7個數(shù)據(jù),即第75百分位數(shù)為95,所以A選項正確;
對于B選項:線性回歸方程不一定經(jīng)過點,,,中的任何一個點,但一定經(jīng)過樣本的中心點即,所以B選項錯誤;
對于C選項:若兩個具有線性相關(guān)關(guān)系的變量的相關(guān)性越強,則線性相關(guān)系數(shù)的絕對值越接近于,所以C選項正確;
對于D選項:因為,則,
則事件與相互獨立,所以事件A與B不互斥,所以D選項正確;
故選:ACD.
11.(2023春·江西贛州·高二統(tǒng)考期中)直播帶貨已經(jīng)成為農(nóng)民創(chuàng)業(yè)增收的好幫手,數(shù)據(jù)顯示2022年全國農(nóng)村直播電商已達(dá)到573.2萬家.已知2022年某農(nóng)村電商每月直播銷售收入Y(單位:萬元)與月份具有線性相關(guān)關(guān)系,利用該電商全年12個月的直播銷售月收入數(shù)據(jù),求得線性回歸方程為,則下列結(jié)論一定正確的是(????)
A.把代入求得的是第n個月的銷售收入
B.相關(guān)系數(shù)
C.2022年該電商直播銷售收入逐月增加
D.該電商2022年直播銷售總收入為213.6萬元
【答案】D
【分析】根據(jù)線性回歸方程為,分別判斷A,C,D選項,根據(jù)相關(guān)系數(shù)概念判斷B選項.
【詳解】利用求得的是每月直播銷售收入的預(yù)測數(shù)據(jù),與每月直播銷售收入的真實數(shù)據(jù)可能不相同,錯誤;
不是相關(guān)系數(shù),,B錯誤;
,由在回歸直線上,得,所以該電商2022年年直播銷售總收入為萬元.
故選:D.
12.【多選】(2023春·河南南陽·高二校聯(lián)考期中)某產(chǎn)品的售價x(單位:元)與月銷量y(單位:百件)的數(shù)據(jù)如下:
x
13
14
15
16
17
y
19
m
n
13
11
已知當(dāng)時,y關(guān)于x的線性回歸方程為,當(dāng)時,該產(chǎn)品月銷售量為0,下列結(jié)論正確的是(注:利潤=銷售額-成本) (????)
A.
B.
C.若該產(chǎn)品的售價為20元,則估計月銷售金額為10000元
D.若該產(chǎn)品每件的成本為10元,則預(yù)測該產(chǎn)品的月利潤最高為7812.5元
【答案】BCD
【分析】將代入線性回歸方程得到y(tǒng)的估計值是15,不一定正確,故A錯誤;由線性回歸方程過,代入線性回歸方程即可判斷B正確;當(dāng)該產(chǎn)品的售價為20元時,代入線性回歸方程即可判斷C正確;利用二次函數(shù)的最值即可判斷D正確.
【詳解】當(dāng)時,,所以y的估計值是15,則不一定正確,故A錯誤;
由題意可知,
,則,解得,則B正確;
當(dāng)該產(chǎn)品的售價為20元時,月銷量百件,
則估計月銷售金額為元,則C正確;
由題意可知該產(chǎn)品的月利潤的估計值為
百元,
即預(yù)測該產(chǎn)品的月利潤最高為7812.5元,則D正確.
故選:BCD.
13.(2023春·山東濰坊·高二山東省昌樂第一中學(xué)校考階段練習(xí))近年來,新能源產(chǎn)業(yè)蓬勃發(fā)展,已成為一大支柱產(chǎn)業(yè).據(jù)統(tǒng)計,某市一家新能源企業(yè)近5個月的產(chǎn)值如下表,由散點圖知,該企業(yè)產(chǎn)值(億元)與月份代碼線性相關(guān).
月份
6月
7月
8月
9月
10月
月份代碼
1
2
3
4
5
產(chǎn)值(億元
16
20
27
30
37
(1)求出關(guān)于的線性回歸方程;
(2)根據(jù)(1)中的結(jié)果,預(yù)測明年2月份該企業(yè)的產(chǎn)值.
參考公式:.
參考數(shù)據(jù):.
【答案】(1)
(2)57.2億元.
【分析】(1)由已知數(shù)據(jù)結(jié)合回歸方程公式計算關(guān)于的線性回歸方程;
(2)將代入回歸方程即可求出明年2月份該企業(yè)的產(chǎn)值.
【詳解】(1)因為,所以,
所以,
所以關(guān)于的線性回歸方程為,
(2)明年2月份的月份代碼為9,
當(dāng)時,,
所以明年2月份該企業(yè)的產(chǎn)值約為57.2億元.
14.(2023·重慶·統(tǒng)考模擬預(yù)測)風(fēng)力發(fā)電是指把風(fēng)的動能轉(zhuǎn)為電能.2021年前11個月,我國新能源發(fā)電量首次突破1萬億千瓦時大關(guān),其中風(fēng)力發(fā)電達(dá)到5866.7億千瓦時.某校物理課題小組通過查閱國家統(tǒng)計局網(wǎng)站,得到2012年至2020年風(fēng)力發(fā)電量數(shù)據(jù),如下表:
年份
2012
2013
2014
2015
2016
2017
2018
2019
2020
年份代碼
1
2
3
4
5
6
7
8
9
風(fēng)力發(fā)電量(億千瓦時)
955.8
1412
1599.8
1857.7
2370.7
2972.3
3659.7
4060.3
4664.7
下圖為2012年至2020年風(fēng)力發(fā)電量散點圖:
(1)根據(jù)散點圖分析與之間的相關(guān)關(guān)系;
(2)根據(jù)相應(yīng)數(shù)據(jù)計算得,,,求關(guān)于的線性回歸方程(精確到0.1).
附:回歸方程中斜率和截距的最小二乘估計公式分別為:,.
【答案】(1)與呈線性正相關(guān)關(guān)系
(2)
【分析】(1)根據(jù)散點圖進行結(jié)合相關(guān)關(guān)系進行分析即可;
(2)利用最小二乘法代入公式分別計算出即可求得關(guān)于的線性回歸方程.
【詳解】(1)根據(jù)散點圖分析,隨著的增大而增大,與之間存在正相關(guān)關(guān)系,且近似于一條直線.
(2),
,
,
,
,
,
關(guān)于的線性回歸方程為.
題組C 培優(yōu)拔尖練
15.(2023·廣西柳州·柳州高級中學(xué)校聯(lián)考模擬預(yù)測)中國女排曾經(jīng)十度成為世界冠軍,鑄就了響徹中華的女排精神,看過中國女排的紀(jì)錄片后,某大學(xué)掀起“學(xué)習(xí)女排精神,塑造健康體魄”的年度主題活動,一段時間后,學(xué)生的身體素質(zhì)明顯提高,將該大學(xué)近5個月體重超重的人數(shù)進行統(tǒng)計,得到如下表格:
月份x
1
2
3
4
5
體重超重的人數(shù)y
640
540
420
300
200
(1)若該大學(xué)體重超重人數(shù)y與月份變量x(月份變量x依次為1,2,3,4,5…)具有線性相關(guān)關(guān)系,請預(yù)測從第幾月份開始該大學(xué)體重超重的人數(shù)隆至100人以下?
(2)從這5個月中隨機抽取2個月,求抽取的這兩個月中體重超重的人數(shù)都少于500人的概率.
附1:回歸方程中斜率和截距的最小二乘估計公式分別為:,,
附2:參考數(shù)據(jù):,
【答案】(1)6
(2)
【分析】(1)根據(jù)已知求出的值,根據(jù)公式求得,,得出回歸直線方程為.解,即可得出答案;
(2)由已知寫出樣本空間,求出要求事件包含基本事件的個數(shù),根據(jù)古典概型的概率公式,即可得出答案.
【詳解】(1)由已知可得,,
,
又因為,,
所以,,
所以,
所以,,
當(dāng)時,解得:,
可以預(yù)測從第6月份開始該大學(xué)體重超重的人數(shù)降至100人以下.
(2)從這5個月中隨機抽取2個月的基本事件有,,,,,,,,,,共10個基本事件.
抽取的這兩個月中體重超重的人數(shù)都少于500人的基本事件有,,,共3個,
所以抽取的這兩個月中體重超重的人數(shù)都少于500人的概率為.
16.(2023春·吉林長春·高二長春市第二實驗中學(xué)??茧A段練習(xí))為打造“四態(tài)融合、產(chǎn)村一體”,望山、見水、憶鄉(xiāng)愁的美麗鄉(xiāng)村,增加農(nóng)民收入,某鄉(xiāng)政府統(tǒng)計了景區(qū)農(nóng)家樂在2012年-2018年中任選年的接待游客人數(shù)(單位:萬人)的數(shù)據(jù),結(jié)果如下表:
年份
年份代號
接待游客人數(shù)(單位:萬人)
(1)根據(jù)數(shù)據(jù)說明變量,是正相關(guān)還是負(fù)相關(guān);
(2)求相關(guān)系數(shù)的值,并說明年份與接待游客人數(shù)之間線性關(guān)系的強弱.(值精確到)
附:線性回歸方程的斜率的最小二乘法估計公式,相關(guān)系數(shù)的公式分別為,,一般地,當(dāng)?shù)慕^對值大于時,認(rèn)為兩個變量之間有較強的線性相關(guān)程度.
參考數(shù)據(jù):,,,.
【答案】(1)正相關(guān)
(2),年份與接待游客人數(shù)之間有較強的線性相關(guān)程度
【分析】(1)利用最小二乘法計算,即可判斷變量與是正相關(guān);
(2)利用最小二乘法計算,進而判斷相關(guān)性的強弱.
【詳解】(1)由題中數(shù)據(jù)可得,,,
則,
變量的值隨著的值增加而增加,
故與之間是正相關(guān);
(2)由已知得,??????????
故年份與接待游客人數(shù)之間有較強的線性相關(guān)程度.
17.(2023春·河南南陽·高二校聯(lián)考期中)某研發(fā)小組為了解年研發(fā)資金投入量x(單位:億元)對年銷售額y(單位:億元)的影響,結(jié)合近10年的年研發(fā)資金投入量和年銷售額的數(shù)據(jù)(1,2,…10),建立了兩個函數(shù)模型:①,②,其中α,β,λ,t均為常數(shù),e為自然對數(shù)的底數(shù).設(shè), (1,2,…10),經(jīng)過計算得如下數(shù)據(jù).
20
66
770
200
14
460
4.20
3125000
0.308
21500
(1)設(shè)和的相關(guān)系數(shù)為,和的相關(guān)系數(shù)為,請從相關(guān)系數(shù)的角度,選擇一個擬合程度更好的模型.
(2)①根據(jù)(1)中選擇的模型及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(系數(shù)精確到0.01);
②當(dāng)年研發(fā)資金投入量約為億元時,年銷售額大致為億元,若正數(shù)a,b滿足,求的最小值.
參考公式:相關(guān)系數(shù),
線性回歸直線中斜率和截距的最小二乘法估計參數(shù)分別為,.
【答案】(1)模型的擬合程度更好
(2)①;②.
【分析】(1)根據(jù)相關(guān)系數(shù)公式分別計算,并比較的大小,較大的擬合程度更好;
(2)①先由指數(shù)模型兩邊取對數(shù)轉(zhuǎn)化為線性關(guān)系,根據(jù)公式先求解線性回歸方程,再得出y關(guān)于x的回歸方程;
②將年銷售額代入y關(guān)于x的回歸方程,得出的關(guān)系,利用“1”的代換法結(jié)合均值不等式求解結(jié)果.
【詳解】(1),
,
因為,所以從相關(guān)系數(shù)的角度,模型的擬合程度更好.
(2)①因為,所以,即.
由題中數(shù)據(jù)可得,
則,
從而v關(guān)于x的線性回歸方程為,
故,即.
②將年銷售額億元,代入,得,解得,則.
故
.
因為,
所以.
當(dāng)且僅當(dāng),即時,等號成立,此時,符合題意,
故M的最小值為.
18.(2023·浙江金華·模擬預(yù)測)全國 “兩會”召開的一項重要意義在于將“兩會代表”從人民中得來的信息和要求進行收集及整理,傳達(dá)給中央,“兩會代表”代表著廣大選民的利益,代表選民在“兩會”期間向政府有關(guān)部門提出選民的意見和要求.下表是2011年至2020年歷年全國政協(xié)提案的數(shù)量統(tǒng)計.
年份
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
年份代碼x
1
2
3
4
5
6
7
8
9
10
提案數(shù)量y(單位:千件)
5.762
6.069
5.641
5.875
5.857
5.769
5.21
5.36
5.488
5.044
(1)請用相關(guān)系數(shù)說明y與x之間的關(guān)系可否用線性回歸模型擬合?若能,求y關(guān)于x的一元線性回歸方程;(運算結(jié)果精確到0.01)(若,則線性相關(guān)程度很高,可用直線擬合)
(2)中央政府回應(yīng)2020年“兩會”的熱點議題“戰(zhàn)勝疫情”,以令世界驚嘆的中國速度、中國效率和中國奇跡,社會各階層、各行各業(yè)迅速投身戰(zhàn)“疫”行動,團結(jié)共進、眾志成城.其中一個關(guān)鍵舉措是2021年全國各地全面展開的疫苗接種.為方便市民合理安排疫苗接種,城市便民電子系統(tǒng)即時提供接種點相關(guān)信息,若某疫苗接種點上午和下午接種疫苗分別需要等待20分鐘和40分鐘,而甲、乙市民均在某日接種疫苗,且上午去接種疫苗的概率分別為,要使兩市民需要等待時間的總和的期望值不超過60分鐘,求實數(shù)p的取值范圍.
參考公式:相關(guān)系數(shù),.
參考數(shù)據(jù):.
【答案】(1)能,
(2)
【分析】(1)根據(jù)題中數(shù)據(jù)求得相關(guān)系數(shù),比較可得結(jié)論;求出,,即可得一元線性回歸方程;
(2)設(shè)甲、乙兩人需要排隊的總時間為,確定的可能取值,求得每個值對應(yīng)的概率,可得其分布列,求出其數(shù)學(xué)期望的表達(dá)式,列出不等式,即可求得答案.
【詳解】(1)由題意可得,
因為,
根據(jù)參考數(shù)據(jù),所以相關(guān)系數(shù),即,
所以線性相關(guān)程度很高,可用直線擬合;
由,
所以,
即y關(guān)于x的線性回歸程為.
(2)設(shè)甲、乙兩人需要排隊的總時間為,則的可能取值為,
,
,
,
所以的分布列為:
40
60
80
P
因此,
可得,又,
故實數(shù)p的取值范圍為.
這是一份高中數(shù)學(xué)人教A版 (2019)選擇性必修 第三冊第八章 成對數(shù)據(jù)的統(tǒng)計分析8.2 一元線性回歸模型及其應(yīng)用當(dāng)堂檢測題,共6頁。試卷主要包含了選擇題,填空題,解答題等內(nèi)容,歡迎下載使用。
這是一份人教A版 (2019)選擇性必修 第三冊第八章 成對數(shù)據(jù)的統(tǒng)計分析8.2 一元線性回歸模型及其應(yīng)用優(yōu)秀課后復(fù)習(xí)題,文件包含第02講一元線性回歸模型及其應(yīng)用教師版-高二數(shù)學(xué)同步精品講義人教A版選擇性必修第三冊docx、第02講一元線性回歸模型及其應(yīng)用學(xué)生版-高二數(shù)學(xué)同步精品講義人教A版選擇性必修第三冊docx等2份試卷配套教學(xué)資源,其中試卷共89頁, 歡迎下載使用。
這是一份高中數(shù)學(xué)人教A版 (2019)選擇性必修 第三冊8.2 一元線性回歸模型及其應(yīng)用同步達(dá)標(biāo)檢測題,文件包含人教A版2019選擇性必修三高中數(shù)學(xué)同步82一元線性回歸模型及其應(yīng)用解析版docx、人教A版2019選擇性必修三高中數(shù)學(xué)同步82一元線性回歸模型及其應(yīng)用原卷版docx等2份試卷配套教學(xué)資源,其中試卷共24頁, 歡迎下載使用。
注冊成功