
一、線性回歸
線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個變量之間的關(guān)系(相關(guān)關(guān)系)的方法。
對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸方程的求法為
其中,,,(,)稱為樣本點(diǎn)的中心。
步驟:畫散點(diǎn)圖,如散點(diǎn)圖中的點(diǎn)基本分布在一條直線附近,則這條直線叫這兩個變量的回歸直線,直線斜率k>0,稱兩個變量正相關(guān);k10.828,有99.9%把握稱“A取A1或A2”對“B取B1,B2”有關(guān)系;
若10.828?K2>6.635,有99%把握稱“A取A1或A2”對“B取B1,B2”有關(guān)系;
若6.635?K2>3.841,有95%把握稱“A取A1或A2”對“B取B1,B2”有關(guān)系;
若K2?3.841,沒有把握稱A與B相關(guān)。
【典型例題】
例1.(2022·全國·高三專題練習(xí)(文))在對兩個變量x,y進(jìn)行回歸分析時有下列步驟:
①對所求出的回歸方程作出解釋;②收集數(shù)據(jù)(xi,yi),i=1,2,…,n;
③求回歸方程;④根據(jù)所收集的數(shù)據(jù)繪制散點(diǎn)圖.
則下列操作順序正確的是( )
A.①②④③B.③②④①C.②③①④D.②④③①
例2.(2022·全國·高三專題練習(xí))對于數(shù)據(jù)組,如果由線性回歸方程得到的對應(yīng)于自變量的估計值是,那么將稱為相應(yīng)于點(diǎn)的殘差.某工廠為研究某種產(chǎn)品產(chǎn)量(噸)與所需某種原材料噸)的相關(guān)性,在生產(chǎn)過程中收集4組對應(yīng)數(shù)據(jù)如下表所示:
根據(jù)表中數(shù)據(jù),得出關(guān)于的線性回歸方程為,據(jù)此計算出樣本點(diǎn)處的殘差為-0.15,則表中的值為( )
A.3.3B.4.5C.5D.5.5
例3.(2022·全國·高三專題練習(xí))據(jù)貴州省氣候中心報,2021年6月上旬,我省降水量在15.2-170.3mm之間,畢節(jié)市局地、遵義市北部、銅仁市局地和黔東南州東南部不足50mm,其余均在50mmm以上,局地超過100mm.若我省某地區(qū)2021年端午節(jié)前后3天,每一天下雨的概率均為.通過模擬實驗的方法來估計該地區(qū)這3天中恰好有2天下雨的概率,利用計算機(jī)或計算器可以產(chǎn)生0到9之間取整數(shù)值的隨機(jī)數(shù)(,且)表示是否下雨:當(dāng)時表示該地區(qū)下雨,當(dāng)時,表示該地區(qū)不下雨.因為是3天,所以每三個隨機(jī)數(shù)作為一組,從隨機(jī)數(shù)表中隨機(jī)取得20組數(shù)如下:
332 714 740 945 593 468 491 272 073 445
992 772 951 431 169 332 435 027 898 719
(1)求出k的值,使得該地區(qū)每一天下雨的概率均為;并根據(jù)上述20組隨機(jī)數(shù)估計該地區(qū)這3天中恰好有2天下雨的概率;
(2)2016年到2020年該地區(qū)端午節(jié)當(dāng)天降雨量(單位:mm)如表:
經(jīng)研究表明:從2016年到2020年,該地區(qū)端午節(jié)有降雨的年份的降雨量與年份具有線性相關(guān)關(guān)系,求回歸直線方程.并預(yù)測該地區(qū)2022年端午節(jié)有降雨的話,降雨量約為多少?
參考公式:,.
例4.(2022·全國·高三專題練習(xí)(理))某企業(yè)新研發(fā)了一種產(chǎn)品,產(chǎn)品的成本由原料成本及非原料成本組成.每件產(chǎn)品的非原料成本(元)與生產(chǎn)該產(chǎn)品的數(shù)量(千件)有關(guān),經(jīng)統(tǒng)計得到如下數(shù)據(jù):
根據(jù)以上數(shù)據(jù),繪制了散點(diǎn)圖.觀察散點(diǎn)圖,兩個變量不具有線性相關(guān)關(guān)系,現(xiàn)考慮用反比例函數(shù)模型和指數(shù)函數(shù)模型分別對兩個變量的關(guān)系進(jìn)行擬合.已求得用指數(shù)函數(shù)模型擬合的回歸方程為與的相關(guān)系數(shù).
(1)用反比例函數(shù)模型求關(guān)于的回歸方程;
(2)用相關(guān)系數(shù)判斷上述兩個模型哪一個擬合效果更好(精確到,并用其估計產(chǎn)量為10千件時每件產(chǎn)品的非原料成本.
參考數(shù)據(jù):
參考公式:對于一組數(shù)據(jù),其回歸直線的斜率和截距的最小一乘估計分別為:,,相關(guān)系數(shù)
例5.(2022·全國·高三專題練習(xí))如圖是某小區(qū)2020年1月至2021年1月當(dāng)月在售二手房均價(單位:萬元/平方米)的散點(diǎn)圖.(圖中月份代碼1~13分別對應(yīng)2020年1月~2021年1月).根據(jù)散點(diǎn)圖選擇和兩個模型進(jìn)行擬合,經(jīng)過數(shù)據(jù)處理得到兩個回歸方程分別為和,并得到以下一些統(tǒng)計量的值:
(1)請利用相關(guān)指數(shù)判斷哪個模型的擬合效果更好;
(2)估計該小區(qū)2021年6月份的二手房均價.(精確到萬元/平方米)
參考數(shù)據(jù):,,,,,,,.參考公式:相關(guān)指數(shù).
例6.(2022·全國·高三專題練習(xí))近年來,明代著名醫(yī)藥學(xué)家李時珍故鄉(xiāng)黃岡市蘄春縣大力發(fā)展大健康產(chǎn)業(yè),蘄艾產(chǎn)業(yè)化種植已經(jīng)成為該縣脫貧攻堅的主要產(chǎn)業(yè)之一,已知蘄艾的株高y(單位:cm)與一定范圍內(nèi)的溫度x(單位:℃)有關(guān),現(xiàn)收集了蘄艾的13組觀測數(shù)據(jù),得到如下的散點(diǎn)圖:
現(xiàn)根據(jù)散點(diǎn)圖利用或建立y關(guān)于x的回歸方程,令,得到如下數(shù)據(jù):
且(,)與(,)(i=1,2,3,…,13)的相關(guān)系數(shù)分別為,,且=﹣0.9953.
(1)用相關(guān)系數(shù)說明哪種模型建立y與x的回歸方程更合適;
(2)根據(jù)(1)的結(jié)果及表中數(shù)據(jù),建立關(guān)于x的回歸方程;
(3)已知蘄艾的利潤z與x、y的關(guān)系為,當(dāng)x為何值時,z的預(yù)報值最大.
參考數(shù)據(jù)和公式:0.21×21.22=4.4562,11.67×21.22=247.6374,=15.7365,對于一組數(shù)據(jù)(,)(i=1,2,3,…,n),其回歸直線方程的斜率和截距的最小二乘法估計分別為,,相關(guān)系數(shù).
例7.(2022·河北張家口·高三期末)已知某區(qū)、兩所初級中學(xué)的初一年級在校學(xué)生人數(shù)之比為,該區(qū)教育局為了解雙減政策的落實情況,用分層抽樣的方法在、兩校初一年級在校學(xué)生中共抽取了名學(xué)生,調(diào)查了他們課下做作業(yè)的時間,并根據(jù)調(diào)查結(jié)果繪制了如下頻率分布直方圖:
(1)在抽取的名學(xué)生中,、兩所學(xué)校各抽取的人數(shù)是多少?
(2)該區(qū)教育局想了解學(xué)生做作業(yè)時間的平均時長(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值作代表)和做作業(yè)時長超過小時的學(xué)生比例,請根據(jù)頻率分布直方圖,估計這兩個數(shù)值;
(3)另據(jù)調(diào)查,這人中做作業(yè)時間超過小時的人中的人來自中學(xué),根據(jù)已知條件填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有的把握認(rèn)為“做作業(yè)時間超過小時”與“學(xué)校”有關(guān)?
附表:
附:.
【技能提升訓(xùn)練】
一、單選題
1.(2022·全國·高三專題練習(xí))某工廠的每月各項開支與毛利潤(單位:萬元)之間有如下關(guān)系,與的線性回歸方程,則( )
A.17.5B.17C.15D.15.5
2.(2021·重慶南開中學(xué)高三階段練習(xí))對兩個變量y和x進(jìn)行回歸分析,得到一組樣本數(shù)據(jù):,,…,,則下列說法中不正確的是( )
A.由樣本數(shù)據(jù)得到的回歸方程必過樣本中心
B.殘差平方和越小的模型,擬合的效果越好
C.用相關(guān)指數(shù)R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好
D.若變量y和x之間的相關(guān)系數(shù)為r=-0.9362,則變量y和x之間具有線性相關(guān)關(guān)系
3.(2021·黑龍江·漠河市高級中學(xué)高三階段練習(xí)(文))某單位為了了解辦公樓用電量(度)與氣溫(℃)之間的關(guān)系,隨機(jī)統(tǒng)計了四個工作量與當(dāng)天平均氣溫,并制作了對照表:
由表中數(shù)據(jù)得到線性回歸方程,當(dāng)氣溫為℃時,預(yù)測用電量均為
A.68度B.52度C.12度D.28度
4.(2022·全國·高三專題練習(xí))關(guān)于線性回歸的描述,有下列命題:
①回歸直線一定經(jīng)過樣本中心點(diǎn);
②相關(guān)系數(shù)的絕對值越大,擬合效果越好;
③相關(guān)指數(shù)越接近1擬合效果越好;
④殘差平方和越小,擬合效果越好.
其中正確的命題個數(shù)為( )
A.1B.2C.3D.4
5.(2022·全國·高三專題練習(xí))下列表述中,正確的個數(shù)是( )
①將一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上同一個常數(shù)后,方差不變;
②設(shè)有一個回歸方程,變量增加1個單位時,平均增加5個單位;
③設(shè)具有相關(guān)關(guān)系的兩個變量,的相關(guān)系數(shù)為,那么越接近于0,,之間的線性相關(guān)程度越高;
④在一個列聯(lián)表中,根據(jù)表中數(shù)據(jù)計算得到的觀測值,若的值越大,則認(rèn)為兩個變量間有關(guān)的把握就越大.
A.0B.1C.2D.3
6.(2022·全國·高三專題練習(xí)(文))對兩個變量y與x進(jìn)行回歸分析,分別選擇不同的模型,它們的相關(guān)系數(shù)r如下,其中擬合效果最好的模型是( )
A.0.2B.0.8C.-0.98D.-0.7
7.(2022·全國·高三專題練習(xí))對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得以下散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是( )
A.B.
C.D.
8.(2022·全國·高三專題練習(xí)(理))如果發(fā)現(xiàn)散點(diǎn)圖中所有的樣本點(diǎn)都落在一條斜率為非0實數(shù)的直線上,則下列說法錯誤的是( )
A.解釋變量和預(yù)報變量是一次函數(shù)關(guān)系B.相關(guān)系數(shù)
C.相關(guān)指數(shù)D.殘差平方和為0
9.(2022·全國·高三專題練習(xí)(理))對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是( )
A.B.
C.D.
10.(2022·全國·高三專題練習(xí)(理))變量x,y的線性相關(guān)系數(shù)為,變量m,n的線性相關(guān)系數(shù)為,下列說法錯誤的是( )
A.若,則說明變量x,y之間線性相關(guān)性強(qiáng)
B.若,則說明變量x,y之間的線性相關(guān)性比變量m,n之間的線性相關(guān)性強(qiáng)
C.若,則說明變量x,y之間的相關(guān)性為正相關(guān)
D.若,則說明變量x,y之間線性不相關(guān)
11.(2022·全國·高三專題練習(xí)(文))已知相關(guān)變量和的散點(diǎn)圖如圖所示,若用與擬合時的相關(guān)系數(shù)分別為則比較的大小結(jié)果為( )
A.B.C.D.不確定
12.(2022·全國·高三專題練習(xí)(文))在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點(diǎn)圖中,若所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為( )
A.-1B.0C.D.1
13.(2022·全國·高三專題練習(xí))如圖,5個數(shù)據(jù),去掉后,下列說法錯誤的是( )
A.相關(guān)系數(shù)r變大B.殘差平方和變大
C.R2變大D.解釋變量x與預(yù)報變量y的相關(guān)性變強(qiáng)
14.(2022·全國·高三專題練習(xí))某公交公司推出掃碼支付乘車優(yōu)惠活動,活動為期兩周,活動的前五天數(shù)據(jù)如下表:
由表中數(shù)據(jù)可得y關(guān)于x的回歸方程為,則據(jù)此回歸模型相應(yīng)于點(diǎn)(2,173)的殘差為( )
A.B.C.3D.2
15.(2022·全國·高三專題練習(xí))隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡單隨機(jī)抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.
計算得,.
參照下表,
下列結(jié)論正確的是( )
A.在犯錯誤的概率不超過的前提下,認(rèn)為“生育意愿與城市級別有關(guān)”
B.在犯錯誤的概率不超過的前提下,認(rèn)為“生育意愿與城市級別無關(guān)”
C.有以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”
D.有以上的把握認(rèn)為“生育意愿與城市級別無關(guān)”
16.(2022·全國·高三專題練習(xí))2018世界特色魅力城市200強(qiáng)新鮮出爐,包括黃山市在內(nèi)的28個中國城市入選,美麗的黃山風(fēng)景和人文景觀迎來眾多賓客.現(xiàn)在很多人喜歡“自助游”,某調(diào)查機(jī)構(gòu)為了了解“自助游”是否與性別有關(guān),在黃山旅游節(jié)期間,隨機(jī)抽取了100人,得如下所示的列聯(lián)表:
參考公式:,其中.
參照公式,得到的正確結(jié)論是( )
A.有以上的把握認(rèn)為“贊成‘自助游’與性別無關(guān)”
B.有以上的把握認(rèn)為“贊成‘自助游’與性別有關(guān)”
C.在犯錯誤的概率不超過的前提下,認(rèn)為“贊成‘自助游’與性別無關(guān)”
D.在犯錯誤的概率不超過的前提下,認(rèn)為“贊成‘自助游’與性別有關(guān)”
17.(2022·全國·高三專題練習(xí)(文))為了了解某高中生對電視臺某節(jié)目的態(tài)度,在某中學(xué)隨機(jī)調(diào)查了110名同學(xué),得到如下列聯(lián)表:
由算得.
參照附表,得到的正確結(jié)論是( )
A.在犯錯誤的概率不超過0.1%的前提下,認(rèn)為“喜歡該節(jié)目與性別有關(guān)”
B.在犯錯誤的概率不超過0.1%的前提下,認(rèn)為“喜歡該節(jié)目與性別無關(guān)”
C.有99%的把握認(rèn)為“喜歡該節(jié)目與性別有關(guān)”
D.有99%的把握認(rèn)為“喜歡該節(jié)目與性別無關(guān)”
18.(2022·全國·高三專題練習(xí)(文))為了解某高校學(xué)生使用手機(jī)支付和現(xiàn)金支付的情況,抽取了部分學(xué)生作為樣本,統(tǒng)計其喜歡的支付方式,并制作出如等高條形圖:
根據(jù)圖中的信息,下列結(jié)論中不正確的是( )
A.樣本中多數(shù)男生喜歡手機(jī)支付
B.樣本中的女生數(shù)量少于男生數(shù)量
C.樣本中多數(shù)女生喜歡現(xiàn)金支付
D.樣本中喜歡現(xiàn)金支付的數(shù)量少于喜歡手機(jī)支付的數(shù)量
19.(2021·全國·高三專題練習(xí)(文))現(xiàn)行普通高中學(xué)生在高一時面臨著選科的問題,學(xué)校抽取了部分男?女學(xué)生意愿的一份樣本,制作出如下兩個等高堆積條形圖:
根據(jù)這兩幅圖中的信息,下列哪個統(tǒng)計結(jié)論是不正確的( )
A.樣本中的女生數(shù)量多于男生數(shù)量
B.樣本中有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量
C.樣本中的男生偏愛兩理一文
D.樣本中的女生偏愛兩文一理
二、多選題
20.(2021·山東聊城·三模)對具有相關(guān)關(guān)系的兩個變量x和y進(jìn)行回歸分析時,經(jīng)過隨機(jī)抽樣獲得成對的樣本點(diǎn)數(shù)據(jù),則下列結(jié)論正確的是( )
A.若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線至少經(jīng)過一個樣本點(diǎn)
B.若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線一定經(jīng)過樣本點(diǎn)中心
C.若以模型擬合該組數(shù)據(jù),為了求出回歸方程,設(shè),將其變換后得到線性方程,則a,b的估計值分別是3和6.
D.用來刻畫回歸模型的擬合效果時,若所有樣本點(diǎn)都落在一條斜率為非零實數(shù)的直線上,則的值為1
21.(2021·遼寧朝陽·一模)關(guān)于變量、的個樣本點(diǎn)、、、及其線性回歸方程:,下列說法正確的有( )
A.若相關(guān)系數(shù)越小,則表示、的線性相關(guān)程度越弱
B.若線性回歸方程中的,則表示變量、正相關(guān)
C.若殘差平方和越大,則表示線性回歸方程擬合效果越好
D.若,,則點(diǎn)一定在回歸直線上
22.(2022·江蘇·高三專題練習(xí))則下列說法正確的是( )
A.在回歸分析中,殘差的平方和越小,模型的擬合效果越好;
B.在殘差圖中,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),說明選用的模型比較合適;
C.若數(shù)據(jù),,…,的平均數(shù)為1,則,,…的平均數(shù)為2;
D.對分類變量與的隨機(jī)變量的觀測值來說,越小,判斷“與有關(guān)系”的把握越大.
23.(2022·全國·高三專題練習(xí))針對時下的“抖音熱”,某校團(tuán)委對“學(xué)生性別和喜歡抖音是否有關(guān)”作了一次調(diào)查,其中被調(diào)查的男女生人數(shù)相同,男生喜歡抖音的人數(shù)占男生人數(shù)的,女生喜歡抖音的人數(shù)占女生人數(shù),若有的把握認(rèn)為是否喜歡抖音和性別有關(guān)則調(diào)查人數(shù)中男生可能有( )人
附表:
附:
A.25B.45C.60D.75
三、填空題
24.(2022·全國·高三專題練習(xí))有人發(fā)現(xiàn),多看手機(jī)容易使人近視,下表是調(diào)查機(jī)構(gòu)對此現(xiàn)象的調(diào)查數(shù)據(jù):
則在犯錯誤的概率不超過__________的前提下認(rèn)為近視與多看手機(jī)有關(guān)系.
附表:
參考公式:,其中.
四、解答題
25.(2022·全國·高三專題練習(xí)(文))近年來,新能源產(chǎn)業(yè)蓬勃發(fā)展,已成為我市的一大支柱產(chǎn)業(yè).據(jù)統(tǒng)計,我市一家新能源企業(yè)近5個月的產(chǎn)值如下表:
(1)根據(jù)上表數(shù)據(jù),計算與的線性相關(guān)系數(shù),并說明與的線性相關(guān)性強(qiáng)弱;(,則認(rèn)為與線性相關(guān)性很強(qiáng);,則認(rèn)為與線性相關(guān)性不強(qiáng))
(2)求出關(guān)于的線性回歸方程,并預(yù)測10月該企業(yè)的產(chǎn)值.
參考公式:;
參考數(shù)據(jù):.
26.(2021·江西·模擬預(yù)測(文))某科技公司研發(fā)了一項新產(chǎn)品,經(jīng)過市場調(diào)研,對公司1月份至6月份銷售量及銷售單價進(jìn)行統(tǒng)計,銷售單價(千元)和銷售量(千件)之間的一組數(shù)據(jù)如下表所示:
(1)試根據(jù)1至5月份的數(shù)據(jù),建立關(guān)于的回歸直線方程;
(2)若由回歸直線方程得到的估計數(shù)據(jù)與剩下的檢驗數(shù)據(jù)的誤差不超過千元,則認(rèn)為所得到的回歸直線方程是理想的,試問(1)中所得到的回歸直線方程是否理想?
參考公式:回歸直線方程,其中.
參考數(shù)據(jù):,.
27.(2022·河南·溫縣第一高級中學(xué)高三階段練習(xí)(理))身高體重指數(shù)(BMI)的大小直接關(guān)系到人的健康狀況,某高中高三(1)班班主任為了解該班學(xué)生的身體健康狀況,從該班學(xué)生中隨機(jī)選取5名學(xué)生,測量其身高、體重(數(shù)據(jù)如下表)并進(jìn)行線性回歸分析,得到線性回歸方程為,因為某些原因,3號學(xué)生的體重數(shù)據(jù)丟失.
(1)求表格中的值;
(2)已知公式可以用來刻畫回歸的效果,請問學(xué)生的體重差異約有百分之多少是由身高引起的.(注:結(jié)果四舍五入取整數(shù))
28.(2022·全國·高三專題練習(xí))2021年6月17日9時22分,我國酒泉衛(wèi)星發(fā)射中心用長征遙十二運(yùn)載火箭,成功將神舟十二號載人飛船送入預(yù)定軌道,順利將聶海勝、劉伯明、湯洪波3名航天員送入太空,發(fā)射取得圓滿成功,這標(biāo)志著中國人首次進(jìn)入自己的空間站.某公司負(fù)責(zé)生產(chǎn)的A型材料是神舟十二號的重要零件,該材料應(yīng)用前景十分廣泛.該公司為了將A型材料更好地投入商用,擬對A型材料進(jìn)行應(yīng)用改造、根據(jù)市場調(diào)研與模擬,得到應(yīng)用改造投入x(億元)與產(chǎn)品的直接收益y(億元)的數(shù)據(jù)統(tǒng)計如下:
當(dāng)時,建立了y與x的兩個回歸模型:模型①:,模型②:;當(dāng)時,確定y與x滿足的線性回歸方程為.
(1)根據(jù)下列表格中的數(shù)據(jù),比較當(dāng)時模型①,②的相關(guān)指數(shù)的大小,并選擇擬合精度更高、更可靠的模型,預(yù)測對A型材料進(jìn)行應(yīng)用改造的投入為17億元時的直接收益;
(2)為鼓勵科技創(chuàng)新,當(dāng)應(yīng)用改造的投入不少于20億元時,國家給予公司補(bǔ)貼5億元,以回歸方程為預(yù)測依據(jù),根據(jù)(1)中選擇的擬合精度更高更可靠的模型,比較投入17億元與20億元時公司收益(直接收益+國家補(bǔ)貼)的大?。?br>附:刻畫回歸效果的相關(guān)指數(shù),且當(dāng)越大時,回歸方程的擬合效果越好..
用最小二乘法求線性回歸方程的截距:.
29.(2021·河南·一模(文))近年來,政府相關(guān)部門引導(dǎo)鄉(xiāng)村發(fā)展旅游的同時,鼓勵農(nóng)戶建設(shè)溫室大棚種植高品質(zhì)農(nóng)作物.為了解某農(nóng)作物的大棚種植面積對種植管理成本的影響,甲,乙兩同學(xué)一起收集6家農(nóng)戶的數(shù)據(jù),進(jìn)行回歸分析,得到兩個回歸摸型:模型①:,模型②: ,對以上兩個回歸方程進(jìn)行殘差分析,得到下表:
(1)將以上表格補(bǔ)充完整,并根據(jù)殘差平方和判斷哪個模型擬合效果更好;
(2)視殘差的絕對值超過1.5的數(shù)據(jù)視為異常數(shù)據(jù),針對(1)中擬合效果較好的模型,剔除異常數(shù)據(jù)后,重新求回歸方程.
附:, ;
30.(2021·全國·模擬預(yù)測)婺源位于江西省東北部,其境內(nèi)古村落遍布鄉(xiāng)野,保存完整,生態(tài)優(yōu)美,物產(chǎn)豐富,擁有著油菜花之鄉(xiāng)的美譽(yù),被譽(yù)為一顆鑲嵌在贛、浙、皖三省交界處的綠色明珠.為了調(diào)查某片實驗田3月份油菜花的生長高度,研究人員在當(dāng)?shù)仉S機(jī)抽取了13株油菜花進(jìn)行高度測量,所得數(shù)據(jù)如下:,,,,,,,,.并通過繪制及觀察散點(diǎn)圖,選用兩種模型進(jìn)行擬合:
模型一:,其中令;
模型二:,其中令.
(1)求模型二的回歸方程;
(2)試通過計算相關(guān)系數(shù)的大小,說明對于所給數(shù)據(jù),哪一種模型更加合適.
參考數(shù)據(jù):,,,.
附:對于一組數(shù)據(jù),,…,,其回歸方程的斜率和截距的最小二乘估計分別為,,相關(guān)系數(shù).
31.(2021·陜西·西安中學(xué)高三階段練習(xí)(文))我國為全面建設(shè)社會主義現(xiàn)代化國家,制定了從2021年到2025年的“十四五”規(guī)劃.某企業(yè)為響應(yīng)國家號召,匯聚科研力量,加強(qiáng)科技創(chuàng)新,準(zhǔn)備增加研發(fā)資金,現(xiàn)該企業(yè)為了解年研發(fā)資金投入額x(單位:億元)對年盈利額y(單位:億元)的影響,研究了“十二五”和“十三五”規(guī)劃發(fā)展期間近10年年研發(fā)資金投入額和年盈利額的數(shù)據(jù).通過對比分析,建立了兩個函數(shù)模型:①;②,其中均為常數(shù),e為自然對數(shù)的底數(shù).令,,經(jīng)計算得如下數(shù)據(jù):
(1)請從相關(guān)系數(shù)的角度,分析哪一個模型擬合程度更好;
(2)根據(jù)(1)的選擇及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(回歸系數(shù)精確到0.01).
附:相關(guān)系數(shù),
線性回歸直線方程,其中附:,.
32.(2021·四川·成都七中一模(文))某投資公司2012年至2021年每年的投資金額(單位:萬元)與年利潤增量(單位:萬元)的散點(diǎn)圖如圖:該投資公司為了預(yù)測2022年投資金額為20萬元時的年利潤增量,建立了關(guān)于的兩個回歸模型;模型①:由最小二乘公式可求得與的線性回歸方程:;模型②:由圖中樣本點(diǎn)的分布,可以認(rèn)為樣本點(diǎn)集中在由線:的附近,對投資金額做換元,令,則,且有,
(1)根據(jù)所給的統(tǒng)計量,求模型②中關(guān)于的回歸方程;
(2)分別利用這兩個回歸模型,預(yù)測投資金額為20萬元時的年利潤增量(結(jié)果保留兩位小數(shù));
附:樣本的最小乘估計公式為;參考數(shù)據(jù):.
33.(2021·云南師大附中高三階段練習(xí)(文))近年來,由于耕地面積的緊張,化肥的施用量呈增加趨勢.一方面,化肥的施用對糧食增產(chǎn)增收起到了關(guān)鍵作用,另一方面,也成為環(huán)境污染、空氣污染、土壤污染的重要來源之一如何合理地施用化肥,使其最大程度地促進(jìn)糧食增產(chǎn),減少對周圍環(huán)境的污染成為需要解決的重要問題研究糧食產(chǎn)量與化肥施用量的關(guān)系,成為解決上述問題的前提某研究團(tuán)隊收集了10組化肥施用量和糧食畝產(chǎn)量的數(shù)據(jù)并對這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計量的值化肥施用量為(單位:公斤),糧食畝產(chǎn)量為(單位:百公斤).
參考數(shù)據(jù):
表中.
(1)根據(jù)散點(diǎn)圖判斷,與,哪一個適宜作為糧食畝產(chǎn)量關(guān)于化肥施用量的回歸方程類型(給出判斷即可,不必說明理由);
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立關(guān)于的回歸方程;
(3)根據(jù)(2)的回歸方程,并預(yù)測化肥施用量為27公斤時,糧食畝產(chǎn)量的值;
附:①對于一組數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計分別為;②取.
34.(2021·河北·高三階段練習(xí))《2021新銳品牌數(shù)字化運(yùn)營白皮書》中,我國提出了新銳品牌的概念,全稱是國貨新銳品牌.對這個名稱進(jìn)行拆解:國貨?新?銳.新有兩個層面,一是針對企業(yè)本身,指2011年后成立的品牌.二是針對消費(fèi)者本身,開拓了新的消費(fèi)場景(需求),形成了細(xì)分化的品類.銳:是在短期內(nèi)實現(xiàn)大大高于傳統(tǒng)品牌的爆發(fā)式增長,并且占據(jù)了一定的消費(fèi)者心智.如圖是11月份中國某信息網(wǎng)發(fā)布的我國市2021年上半年新銳品牌人群用戶(新銳品牌人群,指在指定周期內(nèi)瀏覽新銳品牌相關(guān)內(nèi)容以及商品詳情頁的人群)性別分析數(shù)據(jù).市對購買家電類新銳品牌人群中隨機(jī)調(diào)查了100位男性顧客和100位女性顧客,統(tǒng)計出每位顧客購買家電消費(fèi)金額,根據(jù)這些數(shù)據(jù)得到如下的頻數(shù)分布表:
(1)若以我國市2021年上半年新銳品牌人群用戶性別分析數(shù)據(jù)作為市抽取新銳品牌人群中性別概率,從市新銳品牌人群中隨機(jī)抽取四人,為四人中男性的人數(shù),求的概率分布列和期望.
(2)根據(jù)市統(tǒng)計購買家電消費(fèi)金額數(shù)據(jù)頻數(shù)分布表,完成下列列聯(lián)表,并根據(jù)列聯(lián)表,判斷是否有99%的把握認(rèn)為購買家電類新銳品牌人群消費(fèi)金額千元以上與性別有關(guān)?
附:,
35.(2022·全國·高三專題練習(xí))某中學(xué)隨機(jī)抽查了名同學(xué)的每天課外閱讀時間,得到如下統(tǒng)計表:
(1)求這名同學(xué)的平均閱讀時長(用區(qū)間中點(diǎn)值代表每個人的閱讀時長);
(2)在閱讀時長位于的人中任選人,求甲同學(xué)被選中的概率;
(3)進(jìn)一步調(diào)查發(fā)現(xiàn),語文成績和每天的課外閱讀時間有很大關(guān)系,每天的課外閱讀時間多于半小時稱為“閱讀迷”,語文成績達(dá)到分視為優(yōu)秀,根據(jù)每天的課外閱讀時間和語文成績是否優(yōu)秀,制成一個列聯(lián)表:
根據(jù)表中數(shù)據(jù),判斷是否有的把握認(rèn)為語文成績是否優(yōu)秀與課外閱讀時間有關(guān).
參考公式:,其中.
參考數(shù)據(jù):
36.(2022·全國·高三專題練習(xí))為了比較注射A,B兩種藥物后產(chǎn)生的皮膚皰疹的面積,選200只家兔做試驗,將這200只家兔隨機(jī)地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.下表1和表2分別是注射藥物A和藥物B后的試驗結(jié)果.(皰疹面積單位:mm2)
表1:注射藥物A后皮膚皰疹面積的頻數(shù)分布表
表2:注射藥物B后皮膚皰疹面積的頻數(shù)分布表
(1)完成下面2×2列聯(lián)表;
(2)能否在犯錯誤概率不超過0.01的前提下,認(rèn)為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”?
37.(2022·全國·高三專題練習(xí))某淘寶店經(jīng)過對春節(jié)七天假期的消費(fèi)者進(jìn)行統(tǒng)計,發(fā)現(xiàn)在金額不超過1000元的消費(fèi)者中男女比例為,該店按此比例抽取了100名消費(fèi)者進(jìn)行進(jìn)一步分析,得到下表女性消費(fèi)情況:
男性消費(fèi)情況:
若消費(fèi)金額不低于600元的網(wǎng)購者為“網(wǎng)購達(dá)人”,低于600元的網(wǎng)購者為“非網(wǎng)購達(dá)人”
(1)分別計算女性和男性消費(fèi)的平均數(shù),并判斷平均消費(fèi)水平高的一方“網(wǎng)購達(dá)人”出手是否更闊綽?
(2)根據(jù)以上統(tǒng)計數(shù)據(jù)填寫如下列聯(lián)表,并回答能否在犯錯誤的概率不超過的前提下認(rèn)為“是否為‘網(wǎng)購達(dá)人’與性別有關(guān)”.
附:.
A1
A2
合計
B1
a
c
a+c
B2
b
d
b+d
合計
a+b
c+d
n=a+b+c+d
3
4
5
6
2.5
3
4
時間
2016年
2017年
2018年
2019年
2020年
年份
1
2
3
4
5
降雨量
28
27
25
23
22
1
2
3
4
5
6
7
8
112
61
35
28
25
24
360
殘差平方和
總偏差平方和
10.15
109.94
3.04
0.16
13.94
-2.1
11.67
0.21
21.22
做作業(yè)時間超過小時
做作業(yè)時間不超過小時
合計
校
校
合計
2
4
5
6
8
30
40
60
50
70
氣溫(℃)
18
13
10
-1
用電量(度)
24
34
38
64
第天
1
2
3
4
5
使用人數(shù)()
15
173
457
842
1333
非一線
一線
總計
愿生
45
20
65
不愿生
13
22
35
總計
58
42
100
0.050
0.010
0.001
3.841
6.635
10.828
贊成“自助游”
不贊成“自助游”
合計
男性
30
15
45
女性
45
10
55
合計
75
25
100
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
男
女
總計
喜歡
40
20
60
不喜歡
20
30
50
總計
60
50
110
0.050
0.010
3.841
6.635
近視
不近視
總計
少看手機(jī)
多看手機(jī)
總計
月 份
5月
6月
7月
8月
9月
月份代碼
1
2
3
4
5
產(chǎn)值億元
16
20
27
30
37
月份
1
2
3
4
5
6
銷售單價
銷售量
學(xué)生編號
1
2
3
4
5
身高
165
170
175
170
170
體重
58
62
65
63
序號
1
2
3
4
5
6
7
8
9
10
11
12
x
2
3
4
6
8
10
13
21
22
23
24
25
y
15
22
27
40
48
54
60
68.5
68
67.5
66
65
回歸模型
模型①
模型②
回歸方程
79.13
20.2
種植面積(畝)
2
3
4
5
7
9
每畝種植管理成本(百元)
25
24
21
22
16
14
模型①
估計值
25.27
23.62
21.97
17.02
13.72
殘差
-0.27
0.38
-0.97
-1.02
0.28
模型②
26.84
20.17
18.83
17.31
16.46
-1.84
0.83
3.17
-1.31
-2.46
26
215
65
2
680
5.36
11250
130
2.6
12
650
91.5
52.5
1478.6
30.5
15
15
46.5
消費(fèi)金額(元)
女性顧客人數(shù)
50
30
10
6
4
男性顧客人數(shù)
20
40
24
10
6
不超千元
千元以上
合計
女性顧客
男性顧客
合計
0.050
0.010
0.001
3.841
6.635
10.828
時長(分)
人數(shù)
閱讀迷
非閱讀迷
合計
語文成績優(yōu)秀
語文成績不優(yōu)秀
合計
皰疹面積
[60,65)
[65,70)
[70,75)
[75,80)
頻數(shù)
30
40
20
10
皰疹面積
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
頻數(shù)
10
25
20
30
15
皰疹面積小于70 mm2
皰疹面積不小于70 mm2
總計
注射藥物A
a=
b=
注射藥物B
c=
d=
總計
n=
消費(fèi)金額(元)
人數(shù)
5
10
15
47
3
消費(fèi)金額(元)
人數(shù)
2
3
10
3
2
女性
男性
合計
“網(wǎng)購達(dá)人”
“非網(wǎng)購達(dá)人”
合計
這是一份新高考數(shù)學(xué)一輪復(fù)習(xí)學(xué)案第27講 統(tǒng)計案例和回歸方程(2份打包,原卷版+解析版),文件包含新高考數(shù)學(xué)一輪復(fù)習(xí)學(xué)案第27講統(tǒng)計案例和回歸方程解析版doc、新高考數(shù)學(xué)一輪復(fù)習(xí)學(xué)案第27講統(tǒng)計案例和回歸方程原卷版doc等2份試卷配套教學(xué)資源,其中試卷共76頁, 歡迎下載使用。
這是一份新高考藝術(shù)生40天突破數(shù)學(xué)90分講義第27講統(tǒng)計案例和回歸方程(原卷版+解析),共70頁。
這是一份2024年高考數(shù)學(xué)第一輪復(fù)習(xí)專題28 統(tǒng)計案例和回歸方程(解析版),共40頁。
微信掃碼,快速注冊
注冊成功