1.變量間的相關(guān)關(guān)系
(1)常見的兩變量之間的關(guān)系有兩類:一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系;與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.
(2)從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),兩個變量的這種相關(guān)關(guān)系稱為正相關(guān),點(diǎn)散布在左上角到右下角的區(qū)域內(nèi),兩個變量的相關(guān)關(guān)系為負(fù)相關(guān).
2.兩個變量的線性相關(guān)
(1)從散點(diǎn)圖上看,如果這些點(diǎn)從整體上看大致分布在通過散點(diǎn)圖中心的一條直線附近,稱兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.
(2)回歸方程為=x+?,其中==, =-.
(3)通過求的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離的平方和最小,這一方法叫做最小二乘法.
(4)相關(guān)系數(shù):
當(dāng)r>0時,表明兩個變量正相關(guān);當(dāng)r<0時,表明兩個變量負(fù)相關(guān).
r的絕對值越接近于1,表明兩個變量的線性相關(guān)性越強(qiáng).r的絕對值越接近于0時,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系.通常|r|大于0.75時,認(rèn)為兩個變量有很強(qiáng)的線性相關(guān)性.?
3.獨(dú)立性檢驗

y1
y2
總計
x1
a
b
a+b
x2
c
d
c+d
總計
a+c
b+d
a+b+c+d
假設(shè)有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為
K2=(其中n=a+b+c+d為樣本容量).
相關(guān)關(guān)系與函數(shù)關(guān)系異同點(diǎn)
共同點(diǎn):二者都是指兩個變量間的關(guān)系.
不同點(diǎn):函數(shù)關(guān)系是一種確定性關(guān)系,體現(xiàn)的是因果關(guān)系;而相關(guān)關(guān)系是一種非確定性關(guān)系,體現(xiàn)的不一定是因果關(guān)系,可能是伴隨關(guān)系.
回歸直線=x+必過樣本點(diǎn)的中心(,),這個結(jié)論既是檢驗所求回歸直線方程是否準(zhǔn)確的依據(jù),也是求參數(shù)的一個依據(jù).
r的符號表明兩個變量是正相關(guān)還是負(fù)相關(guān);|r|的大小表示線性相關(guān)性的強(qiáng)弱.
獨(dú)立性檢驗是對兩個變量有關(guān)系的可信程度的判斷,而不是對其是否有關(guān)系的判斷.
[小題查驗基礎(chǔ)]
一、判斷題(對的打“√”,錯的打“×”)
(1)散點(diǎn)圖是判斷兩個變量是否相關(guān)的一種重要方法和手段.(  )
(2)回歸直線方程=x+至少經(jīng)過點(diǎn)(x1,y1),(x2,y2),…,(xn,yn)中的一個點(diǎn).(  )
(3)若事件X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的K2的觀測值越小.(  )
(4)兩個變量的相關(guān)系數(shù)的絕對值越接近于1,它們的相關(guān)性越強(qiáng).(  )
答案:(1)√ (2)× (3)× (4)√
二、選填題
1.已知變量x,y之間具有線性相關(guān)關(guān)系,其散點(diǎn)圖如圖所示,回歸直線l的方程為=x+,則下列說法正確的是(  )
A.>0,<0
B.>0,>0
C.<0,<0
D.<0,>0
解析:選D 由題圖可知,回歸直線的斜率是正數(shù),即>0;回歸直線在y軸上的截距是負(fù)數(shù),即<0,故選D.
2.為了考察兩個變量x和y之間的線性相關(guān)性,甲、乙兩位同學(xué)各自獨(dú)立地做10次和15次試驗,并且利用線性回歸方法,求得回歸直線分別為l1和l2,已知兩個人在試驗中發(fā)現(xiàn)對變量x的觀測數(shù)據(jù)的平均值都是s,對變量y的觀測數(shù)據(jù)的平均值都是t,那么下列說法正確的是(  )
A.l1和l2必定平行
B.l1與l2必定重合
C.l1和l2一定有公共點(diǎn)(s,t)
D.l1與l2相交,但交點(diǎn)不一定是(s,t)
解析:選C 注意到回歸直線必經(jīng)過樣本中心點(diǎn).
3.下面是2×2列聯(lián)表:

y1
y2
總計
x1
a
21
73
x2
22
25
47
總計
b
46
120
則表中a,b的值分別為________,________.
解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.
答案:52 74
4.已知x,y的取值如下表,從散點(diǎn)圖可以看出y與x具有線性相關(guān)關(guān)系,且回歸方程為=0.95x+,則=________.
x
0
1
3
4
y
2.2
4.3
4.8
6.7

解析:∵回歸直線必過樣本點(diǎn)的中心(,),又=2,=4.5,代入回歸方程,得=2.6.
答案:2.6


[題組練透]
1.兩個變量的相關(guān)關(guān)系有①正相關(guān),②負(fù)相關(guān),③不相關(guān),則下列散點(diǎn)圖從左到右分別反映的變量間的相關(guān)關(guān)系是(  )

A.①②③        B.②③①
C.②①③ D.①③②
解析:選D 第一個散點(diǎn)圖中,散點(diǎn)圖中的點(diǎn)是從左下角區(qū)域分布到右上角區(qū)域,則是正相關(guān);第三個散點(diǎn)圖中,散點(diǎn)圖中的點(diǎn)是從左上角區(qū)域分布到右下角區(qū)域,則是負(fù)相關(guān);第二個散點(diǎn)圖中,散點(diǎn)圖中的點(diǎn)的分布沒有什么規(guī)律,則是不相關(guān),所以應(yīng)該是①③②.
2.已知變量x和y滿足關(guān)系y=-0.1x+1,變量y與z正相關(guān).下列結(jié)論中正確的是(  )
A.x與y正相關(guān),x與z負(fù)相關(guān)
B.x與y正相關(guān),x與z正相關(guān)
C.x與y負(fù)相關(guān),x與z負(fù)相關(guān)
D.x與y負(fù)相關(guān),x與z正相關(guān)
解析:選C 因為y=-0.1x+1的斜率小于0,
故x與y負(fù)相關(guān).因為y與z正相關(guān),可設(shè)z=y(tǒng)+,>0,則z=y(tǒng)+=-0.1x++,故x與z負(fù)相關(guān).
3.在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點(diǎn)圖中,若所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為(  )
A.-1 B.0
C. D.1
解析:選D 所有樣本點(diǎn)均在同一條斜率為正數(shù)的直線上,則樣本相關(guān)系數(shù)最大,為1,故選D.
4.變量X與Y相應(yīng)的一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量U與V相對應(yīng)的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示變量Y與X之間的線性相關(guān)系數(shù),r2表示變量V與U之間的線性相關(guān)系數(shù),則(  )
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
解析:選C 對于變量Y與X而言,Y隨X的增大而增大,故Y與X正相關(guān),即r1>0;對于變量V與U而言,V隨U的增大而減小,故V與U負(fù)相關(guān),即r2<0,故選C.
[名師微點(diǎn)]
判斷相關(guān)關(guān)系的2種方法
(1)散點(diǎn)圖法:如果所有的樣本點(diǎn)都落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系.如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系.
(2)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判定,當(dāng)|r|越趨近于1相關(guān)性越強(qiáng).

[典例精析]
下圖是我國2011年至2017年生活垃圾無害化處理量(單位:億噸)的折線圖.

(1)由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請用相關(guān)系數(shù)加以說明;
(2)建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預(yù)測2019年我國生活垃圾無害化處理量.
參考數(shù)據(jù):i=9.32,iyi=40.17, =0.55,≈2.646.
參考公式:相關(guān)系數(shù)r=,回歸方程=+t中斜率和截距的最小二乘估計公式分別為=,=- .
[解] (1)由折線圖中的數(shù)據(jù)和附注中的參考數(shù)據(jù)得
=4,(ti-)2=28, =0.55,
(ti-)(yi-)=iyi-i=40.17-4×9.32=2.89,
∴r≈≈0.99.
因為y與t的相關(guān)系數(shù)近似為0.99,說明y與t的線性相關(guān)程度相當(dāng)大,從而可以用線性回歸模型擬合y與t的關(guān)系.
(2)由=≈1.331及(1)得
==≈0.103.
=- ≈1.331-0.103×4≈0.92.
所以y關(guān)于t的回歸方程為=0.92+0.10t.
將2019年對應(yīng)的t=9代入回歸方程得=0.92+0.10×9=1.82.
所以,預(yù)測2019年我國生活垃圾無害化處理量約為1.82億噸.
[解題技法]
1.線性回歸分析問題的類型及解題方法
(1)求線性回歸方程
①利用公式,求出回歸系數(shù),.
②待定系數(shù)法:利用回歸直線過樣本點(diǎn)的中心求系數(shù).
(2)利用回歸方程進(jìn)行預(yù)測,把線性回歸方程看作一次函數(shù),求函數(shù)值.
(3)利用回歸直線判斷正、負(fù)相關(guān),決定正相關(guān)還是負(fù)相關(guān)的是系數(shù).
(4)回歸方程的擬合效果,可以利用相關(guān)系數(shù)判斷,當(dāng)|r|越趨近于1時,兩變量的線性相關(guān)性越強(qiáng).
2.模型擬合效果的判斷
(1)殘差平方和越小,模型的擬合效果越好.
(2)相關(guān)指數(shù)R2越大,模型的擬合效果越好.
(3)回歸方程的擬合效果,可以利用相關(guān)系數(shù)判斷,當(dāng)|r|越趨近于1時,兩變量的線性相關(guān)性越強(qiáng).

[過關(guān)訓(xùn)練]
1.(2019·廣州調(diào)研)某基地蔬菜大棚采用無土栽培方式種植各類蔬菜.過去50周的資料顯示,該地周光照量X(單位:小時)都在30小時以上,其中不足50小時的有5周,不低于50小時且不超過70小時的有35周,超過70小時的有10周.根據(jù)統(tǒng)計,該基地的西紅柿增加量y(千克)與使用某種液體肥料的質(zhì)量x(千克)之間的對應(yīng)數(shù)據(jù)為如圖所示的折線圖.
(1)依據(jù)折線圖計算相關(guān)系數(shù)r(精確到0.01),并據(jù)此判斷是否可用線性回歸模型擬合y與x的關(guān)系.(若|r|>0.75,則線性相關(guān)程度很高,可用線性回歸模型擬合)
(2)蔬菜大棚對光照要求較高,某光照控制儀商家為該基地提供了部分光照控制儀,但每周光照控制儀運(yùn)行臺數(shù)受周光照量X限制,并有如下關(guān)系:
周光照量X/小時
30<X<50
50≤X≤70
X>70
光照控制儀運(yùn)行臺數(shù)
3
2
1

對商家來說,若某臺光照控制儀運(yùn)行,則該臺光照控制儀產(chǎn)生的周利潤為3 000元;若某臺光照控制儀未運(yùn)行,則該臺光照控制儀周虧損1 000元.若商家安裝了3臺光照控制儀,求商家在過去50周的周總利潤的平均值.
參考數(shù)據(jù):≈0.55,≈0.95.
解:(1)由已知數(shù)據(jù)可得==5,
==4.
因為(xi-)(yi-)=(-3)×(-1)+0+0+0+3×1=6,
==2,
==,
所以相關(guān)系數(shù)r=== ≈0.95.
因為|r|>0.75,所以可用線性回歸模型擬合y與x的關(guān)系.
(2)由條件可得在過去50周里,
當(dāng)X>70時,共有10周,此時只有1臺光照控制儀運(yùn)行,
每周的周總利潤為1×3 000-2×1 000=1 000(元).
當(dāng)50≤X≤70時,共有35周,此時有2臺光照控制儀運(yùn)行,
每周的周總利潤為2×3 000-1×1 000=5 000(元).
當(dāng)30<X<50時,共有5周,此時3臺光照控制儀都運(yùn)行,
每周的周總利潤為3×3 000=9 000(元).
所以過去50周的周總利潤的平均值為
=4 600(元),
所以商家在過去50周的周總利潤的平均值為4 600元.
2.某機(jī)構(gòu)為研究某種圖書每冊的成本費(fèi)y(單位:元)與印刷數(shù)量x(單位:千冊)的關(guān)系,收集了一些數(shù)據(jù)并進(jìn)行了初步處理,得到了下面的散點(diǎn)圖及一些統(tǒng)計量的值.




(xi-)2
(xi-)(yi-)
(ui-)2
(ui-)(yi-)
15.25
3.63
0.269
2 085.5
-230.3
0.787
7.049
表中ui=,=i.
(1)根據(jù)散點(diǎn)圖判斷:y=a+bx與y=c+哪一個模型更適合作為該圖書每冊的成本費(fèi)y(單位:元)與印刷數(shù)量x(單位:千冊)的回歸方程?(只要求給出判斷,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(回歸系數(shù)的結(jié)果精確到0.01).
(3)若該圖書每冊的定價為10元,則至少應(yīng)該印刷多少冊才能使銷售利潤不低于78 840元?(假設(shè)能夠全部售出.結(jié)果精確到1)
附:對于一組數(shù)據(jù)(ω1,υ1),(ω2,υ2),…,(ωn,υn),其回歸直線=+ω的斜率和截距的最小二乘估計分別為=,=-.
解:(1)由散點(diǎn)圖判斷,y=c+更適合作為該圖書每冊的成本費(fèi)y(單位:元)與印刷數(shù)量x(單位:千冊)的回歸方程.
(2)令u=,先建立y關(guān)于u的線性回歸方程,
由于==≈8.957≈8.96,
∴=-·=3.63-8.957×0.269≈1.22,
∴y關(guān)于u的線性回歸方程為=1.22+8.96u,
∴y關(guān)于x的回歸方程為=1.22+.
(3)假設(shè)印刷x千冊,
依題意得10x-x≥78.840,
解得x≥10,
∴至少印刷10 000冊才能使銷售利潤不低于78 840元.

[典例精析]
(2019·河北名校聯(lián)考)某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在[29.94,30.06)的零件為優(yōu)質(zhì)品.從兩個分廠生產(chǎn)的零件中各抽出了500件,量其內(nèi)徑尺寸,得結(jié)果如下表:
甲廠:
分組
[29.86,29.90)
[29.90,29.94)
[29.94,29.98)
[29.98,30.02)
頻數(shù)
12
63
86
182

分組
[30.02,30.06)
[30.06,30.10)
[30.10,30.14]

頻數(shù)
92
61
4

乙廠:
分組
[29.86,29.90)
[29.90,29.94)
[29.94,29.98)
[29.98,30.02)
頻數(shù)
29
71
85
159

分組
[30.02,30.06)
[30.06,30.10)
[30.10,30.14]

頻數(shù)
76
62
18


(1)試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;
(2)由以上統(tǒng)計數(shù)據(jù)完成下面2×2列聯(lián)表,并判斷是否有99%的把握認(rèn)為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”.
甲廠
乙廠
總計
優(yōu)質(zhì)品


非優(yōu)質(zhì)品


總計



[解] (1)甲廠抽查的500件產(chǎn)品中有360件優(yōu)質(zhì)品,從而估計甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率為×100%=72%;
乙廠抽查的500件產(chǎn)品中有320件優(yōu)質(zhì)品,從而估計乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率為×100%=64%.
(2)完成的2×2列聯(lián)表如下:

甲廠
乙廠
總計
優(yōu)質(zhì)品
360
320
680
非優(yōu)質(zhì)品
140
180
320
總計
500
500
1 000

由表中數(shù)據(jù)計算得,
K2=≈7.353>6.635,
所以有99%的把握認(rèn)為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”.
[解題技法]
獨(dú)立性檢驗的一般步驟
(1)根據(jù)樣本數(shù)據(jù)列出2×2列聯(lián)表.
(2)計算隨機(jī)變量K2的觀測值k,查下表確定臨界值k0:
P(K2≥k0)
0.50
0.40
0.25
0.15
0.10
k0
0.455
0.708
1.323
2.072
2.706

P(K2≥k0)
0.05
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
(3)如果k≥k0,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過P(K2≥k0);否則,就認(rèn)為在犯錯誤的概率不超過P(K2≥k0)的前提下不能推斷“X與Y有關(guān)”.
[過關(guān)訓(xùn)練]
(2018·全國卷Ⅲ)某工廠為提高生產(chǎn)效率,開展技術(shù)創(chuàng)新活動,提出了完成某項生產(chǎn)任務(wù)的兩種新的生產(chǎn)方式.為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機(jī)分成兩組,每組20人.第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務(wù)的工作時間(單位:min)繪制了如下莖葉圖:

(1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說明理由.
(2)求40名工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)m,并將完成生產(chǎn)任務(wù)所需時間超過m和不超過m的工人數(shù)填入下面的列聯(lián)表:

超過m
不超過m
第一種生產(chǎn)方式


第二種生產(chǎn)方式



(3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認(rèn)為兩種生產(chǎn)方式的效率有差異?
附:K2=,

解:(1)第二種生產(chǎn)方式的效率更高.
理由如下:
(ⅰ)由莖葉圖可知:用第一種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時間高于80 min,用第二種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時間低于79 min.因此第二種生產(chǎn)方式的效率更高.
(ⅱ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)為85.5 min,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)為73.5 min.因此第二種生產(chǎn)方式的效率更高.
(ⅲ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需平均時間高于80 min;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需平均時間低于80 min.因此第二種生產(chǎn)方式的效率更高.
(ⅳ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布在莖8上的最多,關(guān)于莖8大致呈對稱分布;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布在莖7上的最多,關(guān)于莖7大致呈對稱分布.又用兩種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布的區(qū)間相同,故可以認(rèn)為用第二種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時間比用第一種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時間更少.因此第二種生產(chǎn)方式的效率更高.
(以上給出了4種理由,考生答出其中任意一種或其他合理理由均可得分)
(2)由莖葉圖知m==80.
列聯(lián)表如下:

超過m
不超過m
第一種生產(chǎn)方式
15
5
第二種生產(chǎn)方式
5
15

(3)因為K2==10>6.635,所以有99%的把握認(rèn)為兩種生產(chǎn)方式的效率有差異.

一、題點(diǎn)全面練
1.根據(jù)如下樣本數(shù)據(jù):
x
3
4
5
6
7
8
y
4.0
2.5
0.5
0.5
0.4
0.1

得到的線性回歸方程為=x+,則(  )
A.>0,>0      B.>0,<0
C.<0,>0 D.<0,<0
解析:選B 根據(jù)給出的數(shù)據(jù)可發(fā)現(xiàn):整體上y與x呈現(xiàn)負(fù)相關(guān),所以<0,由樣本點(diǎn)(3,4.0)及(4,2.5)可知>0,故選B.
2.隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡單隨機(jī)抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.

非一線
一線
總計
愿生
45
20
65
不愿生
13
22
35
總計
58
42
100
由K2=,
得K2=≈9.616.
參照下表,
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
正確的結(jié)論是(  )
A.在犯錯誤的概率不超過0.1%的前提下,認(rèn)為“生育意愿與城市級別有關(guān)”
B.在犯錯誤的概率不超過0.1%的前提下,認(rèn)為“生育意愿與城市級別無關(guān)”
C.有99%以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”
D.有99%以上的把握認(rèn)為“生育意愿與城市級別無關(guān)”
解析:選C ∵K2≈9.616>6.635,∴有99%以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”,故選C.
3.(2018·哈爾濱一模)千年潮未落,風(fēng)起再揚(yáng)帆,為實現(xiàn)“兩個一百年”奮斗目標(biāo)、實現(xiàn)中華民族偉大復(fù)興的中國夢奠定堅實基礎(chǔ),某校積極響應(yīng)國家號召,不斷加大拔尖人才的培養(yǎng)力度,據(jù)不完全統(tǒng)計:
年份/屆
2014
2015
2016
2017
學(xué)科競賽獲省級一等獎及以上的學(xué)生人數(shù)x
51
49
55
57
被清華、北大等世界名校錄取的學(xué)生人數(shù)y
103
96
108
107
根據(jù)上表可得回歸方程=x+中的為1.35,該校2018屆同學(xué)在學(xué)科競賽中獲省級一等獎及以上的學(xué)生人數(shù)為63,據(jù)此模型預(yù)測該校今年被清華、北大等世界名校錄取的學(xué)生人數(shù)為(  )
A.111 B.117
C.118 D.123
解析:選B 因為=53,=103.5,所以=-=103.5-1.35×53=31.95,所以回歸直線方程為=1.35x+31.95.當(dāng)x=63時,代入解得=117,故選B.
4.某考察團(tuán)對10個城市的職工人均工資x(千元)與居民人均消費(fèi)y(千元)進(jìn)行調(diào)查統(tǒng)計,得出y與x具有線性相關(guān)關(guān)系,且線性回歸方程為=0.6x+1.2.若某城市職工人均工資為5千元,估計該城市人均消費(fèi)額占人均工資收入的百分比為(  )
A.66% B.67%
C.79% D.84%
解析:選D ∵y與x具有線性相關(guān)關(guān)系,且滿足回歸方程=0.6x+1.2,該城市居民人均工資為=5,∴可以估計該城市的職工人均消費(fèi)水平=0.6×5+1.2=4.2,∴可以估計該城市人均消費(fèi)額占人均工資收入的百分比為=84%.
5.某煉鋼廠廢品率x(%)與成本y(元/噸)的線性回歸直線方程為=105.492+42.569x.當(dāng)成本控制在176.5元/噸時,可以預(yù)計生產(chǎn)的1 000噸鋼中,約有________噸鋼是廢品(結(jié)果保留兩位小數(shù)).
解析:因為176.5=105.492+42.569x,解得x≈1.668,即當(dāng)成本控制在176.5元/噸時,廢品率約為1.668%,所以生產(chǎn)的1 000噸鋼中,約有1 000×1.668%=16.68噸是廢品.
答案:16.68
6.在一次考試中,5名學(xué)生的數(shù)學(xué)和物理成績?nèi)缦卤恚?已知學(xué)生的數(shù)學(xué)和物理成績具有線性相關(guān)關(guān)系)
學(xué)生的編號i
1
2
3
4
5
數(shù)學(xué)成績x
80
75
70
65
60
物理成績y
70
66
68
64
62

現(xiàn)已知其線性回歸方程為=0.36x+,則根據(jù)此線性回歸方程估計數(shù)學(xué)得90分的同學(xué)的物理成績?yōu)開_______.
(四舍五入到整數(shù))
解析:==70,
==66,
所以66=0.36×70+,即=40.8,
即線性回歸方程為=0.36x+40.8.
當(dāng)x=90時,=0.36×90+40.8=73.2≈73.
答案:73
7.經(jīng)調(diào)查某地若干戶家庭的年收入x(萬元)和年飲食支出y(萬元)具有線性相關(guān)關(guān)系,并得到y(tǒng)關(guān)于x的線性回歸直線方程:=0.245x+0.321,由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均增加________萬元.
解析:x變?yōu)閤+1,=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1萬元,年飲食支出平均增加0.245萬元.
答案:0.245
8.已知某次考試之后,班主任從全班同學(xué)中隨機(jī)抽取一個容量為8的樣本,他們的數(shù)學(xué)、物理成績(單位:分)對應(yīng)如下表:
學(xué)生編號
1
2
3
4
5
6
7
8
數(shù)學(xué)成績
60
65
70
75
80
85
90
95
物理成績
72
77
80
84
88
90
93
95
給出散點(diǎn)圖如下:

根據(jù)以上信息,判斷下列結(jié)論:
①根據(jù)散點(diǎn)圖,可以判斷數(shù)學(xué)成績與物理成績具有線性相關(guān)關(guān)系;
②根據(jù)散點(diǎn)圖,可以判斷數(shù)學(xué)成績與物理成績具有一次函數(shù)關(guān)系;
③從全班隨機(jī)抽取甲、乙兩名同學(xué),若甲同學(xué)數(shù)學(xué)成績?yōu)?0分,乙同學(xué)數(shù)學(xué)成績?yōu)?0分,則甲同學(xué)的物理成績一定比乙同學(xué)的物理成績高.
其中正確的個數(shù)為________.
解析:由散點(diǎn)圖知,各點(diǎn)都分布在一條直線附近,故可以判斷數(shù)學(xué)成績與物理成績具有線性相關(guān)關(guān)系,但不能判斷數(shù)學(xué)成績與物理成績具有一次函數(shù)關(guān)系,故①正確,②錯誤;若甲同學(xué)數(shù)學(xué)成績?yōu)?0分,乙同學(xué)數(shù)學(xué)成績?yōu)?0分,則甲同學(xué)的物理成績可能比乙同學(xué)的物理成績高,故③錯誤.綜上,正確的個數(shù)為1.
答案:1
9.(2019·泉州一模)某測試團(tuán)隊為了研究“飲酒”對“駕車安全”的影響,隨機(jī)選取100名駕駛員先后在無酒狀態(tài)、酒后狀態(tài)下進(jìn)行“停車距離”測試,測試的方案:電腦模擬駕駛,以某速度勻速行駛,記錄下駕駛員的“停車距離”(駕駛員從看到意外情況到車子停下所需要的距離),無酒狀態(tài)與酒后狀態(tài)下的試驗數(shù)據(jù)分別列于下表.
表1
停車距離d(米)
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
頻數(shù)
26
a
b
8
2
表2
平均每毫升血液酒精含量x(毫克)
10
30
50
70
90
平均停車距離y(米)
30
50
60
70
90
已知表1數(shù)據(jù)的中位數(shù)估計值為26,回答以下問題.
(1)求a,b的值,并估計駕駛員無酒狀態(tài)下停車距離的平均數(shù);
(2)根據(jù)最小二乘法,由表2的數(shù)據(jù)計算y關(guān)于x的回歸方程=x+;
(3)該測試團(tuán)隊認(rèn)為:若駕駛員酒后駕車的平均“停車距離”y大于(1)中無酒狀態(tài)下的停車距離平均數(shù)的3倍,則認(rèn)定駕駛員是“醉駕”.請根據(jù)(2)中的回歸方程,預(yù)測當(dāng)每毫升血液酒精含量大于多少毫克時為“醉駕”?
附:回歸方程=x+中,=,=-.
解:(1)依題意,得a=50-26,解得a=40.
又a+b+36=100,解得b=24,故停車距離的平均數(shù)為
15×+25×+35×+45×+55×=27.
(2)依題意,可知=50,=60,
iyi=10×30+30×50+50×60+70×70+90×90=17 800,
=102+302+502+702+902=16 500,
所以==0.7,=60-0.7×50=25,
所以回歸直線方程為=0.7x+25.
(3)由(1)知當(dāng)y>81時,認(rèn)定駕駛員是“醉駕”.
令>81,得0.7x+25>81,解得x>80,
則當(dāng)每毫升血液酒精含量大于80毫克時認(rèn)定為“醉駕”.
10.(2018·豫南九校聯(lián)考)下表為2015年至2018年某百貨零售企業(yè)的線下銷售額(單位:萬元),其中年份代碼x=年份—2014.
年份代碼x
1
2
3
4
線下銷售額y
95
165
230
310

(1)已知y與x具有線性相關(guān)關(guān)系,求y關(guān)于x的線性回歸方程,并預(yù)測2019年該百貨零售企業(yè)的線下銷售額;
(2)隨著網(wǎng)絡(luò)購物的飛速發(fā)展,有不少顧客對該百貨零售企業(yè)的線下銷售額持續(xù)增長表示懷疑,某調(diào)查平臺為了解顧客對該百貨零售企業(yè)的線下銷售額持續(xù)增長的看法,隨機(jī)調(diào)查了55位男顧客、50位女顧客(每位顧客從“持樂觀態(tài)度”和“持不樂觀態(tài)度”中任選一種),其中對該百貨零售企業(yè)的線下銷售額持續(xù)增長持樂觀態(tài)度的男顧客有10人、女顧客有20人,能否在犯錯誤的概率不超過0.025的前提下認(rèn)為對該百貨零售企業(yè)的線下銷售額持續(xù)增長所持的態(tài)度與性別有關(guān)?
參考公式及數(shù)據(jù):
=,=-,
K2=,n=a+b+c+d.
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
k0
2.706
3.841
5.024
6.635
7.879

解:(1)由題意得=2.5,=200,=30,iyi=2 355,所以===71,
所以=-=200-71×2.5=22.5,
所以y關(guān)于x的線性回歸方程為=71x+22.5.
由于2 019-2 014=5,所以當(dāng)x=5時,=71×5+22.5=377.5,所以預(yù)測2019年該百貨零售企業(yè)的線下銷售額為377.5萬元.
(2)由題可得2×2列聯(lián)表如下:

持樂觀態(tài)度
持不樂觀態(tài)度
總計
男顧客
10
45
55
女顧客
20
30
50
總計
30
75
105

故K2=≈6.109.
由于6.109>5.024,所以可以在犯錯誤的概率不超過0.025的前提下認(rèn)為對該百貨零售企業(yè)的線下銷售額持續(xù)增長所持的態(tài)度與性別有關(guān).

二、專項培優(yōu)練
(一)易錯專練——不丟怨枉分
1.(2019·濟(jì)南診斷)某中學(xué)學(xué)生會為了調(diào)查愛好游泳運(yùn)動與性別是否有關(guān),通過隨機(jī)詢問110名性別不同的高中生是否愛好游泳運(yùn)動,得到如下的列聯(lián)表.由K2=并參照附表,得到的正確結(jié)論是(  )



總計
愛好
40
20
60
不愛好
20
30
50
總計
60
50
110
附表:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828

A.在犯錯誤的概率不超過1%的前提下,認(rèn)為“愛好游泳運(yùn)動與性別有關(guān)”
B.在犯錯誤的概率不超過1%的前提下,認(rèn)為“愛好游泳運(yùn)動與性別無關(guān)”
C.有99.9%的把握認(rèn)為“愛好游泳運(yùn)動與性別有關(guān)”
D.有99.9%的把握認(rèn)為“愛好游泳運(yùn)動與性別無關(guān)”
解析:選A 因為K2=≈7.822>6.635,所以有99%的把握認(rèn)為“愛好游泳運(yùn)動與性別有關(guān)”,所以在犯錯誤的概率不超過1%的前提下,認(rèn)為“愛好游泳運(yùn)動與性別有關(guān)”.
2.已知x與y之間的幾組數(shù)據(jù)如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4

假設(shè)根據(jù)上表數(shù)據(jù)所得的線性回歸方程為=x+.若某同學(xué)根據(jù)上表中的前兩組數(shù)據(jù)(1,0)和(2,2)求得的直線方程為y=b′x+a′,則以下結(jié)論正確的是(  )
A.>b′,>a′ B.>b′,<a′
C.< b′,>a′ D.<b′,<a′
解析:選C 由兩組數(shù)據(jù)(1,0)和(2,2)可求得直線方程為y=2x-2,b′=2,a′=-2.而利用線性回歸方程的公式與已知表格中的數(shù)據(jù),可求得===,=-=-×=-,所以<b′,>a′.
3.為了研究某班學(xué)生的腳長x(單位:cm)和身高y(單位:cm)的關(guān)系,從該班隨機(jī)抽取10名學(xué)生,根據(jù)測量數(shù)據(jù)的散點(diǎn)圖可以看出y與x之間有線性相關(guān)關(guān)系,設(shè)其線性回歸方程為=x+.已知i=225,i=1 600,=4.該班某學(xué)生的腳長為24,據(jù)此估計其身高為(  )
A.160 B.163
C.166 D.170
解析:選C ∵i=225,∴=i=22.5.
∵i=1 600,∴=i=160.
又=4,∴=-=160-4×22.5=70.
∴線性回歸方程為=4x+70.
將x=24代入上式,得=4×24+70=166.
(二)素養(yǎng)專練——學(xué)會更學(xué)通
4.[數(shù)學(xué)運(yùn)算]某高中學(xué)校對全體學(xué)生進(jìn)行體育達(dá)標(biāo)測試,每人測試A,B兩個項目,每個項目滿分均為60分.從全體學(xué)生中隨機(jī)抽取了100人,分別統(tǒng)計他們A,B兩個項目的測試成績,得到A項目測試成績的頻率分布直方圖和B項目測試成績的頻數(shù)分布表如下:
        
B項目測試成績頻數(shù)分布表
分?jǐn)?shù)區(qū)間
頻數(shù)
[0,10)
2
[10,20)
3
[20,30)
5
[30,40)
15
[40,50)
40
[50,60]
35
將學(xué)生的成績劃分為三個等級,如下表:
分?jǐn)?shù)
[0,30)
[30,50)
[50,60]
等級
一般
良好
優(yōu)秀

(1)在抽取的100人中,求A項目等級為優(yōu)秀的人數(shù);
(2)已知A項目等級為優(yōu)秀的學(xué)生中女生有14人,A項目等級為一般或良好的學(xué)生中女生有34人,試完成下列2×2列聯(lián)表,并分析是否有95%以上的把握認(rèn)為“A項目等級為優(yōu)秀”與性別有關(guān)?
優(yōu)秀
一般或良好
總計
男生


女生


總計



(3)將樣本的概率作為總體的概率,并假設(shè)A項目和B項目測試成績互不影響,現(xiàn)從該校學(xué)生中隨機(jī)抽取1人進(jìn)行調(diào)查,試估計其A項目等級比B項目等級高的概率.
參考數(shù)據(jù):
P(K2≥k0)
0.10
0.050
0.025
0.010
0.001
k0
2.706
3.841
5.024
6.635
10.828

參考公式K2=,其中n=a+b+c+d.
解:(1)由A項目測試成績頻率分布直方圖,得A項目等級為優(yōu)秀的頻率為0.04×10=0.4,
所以A項目等級為優(yōu)秀的人數(shù)為0.4×100=40.
(2)由(1)知A項目等級為優(yōu)秀的學(xué)生中,女生數(shù)為14人,男生數(shù)為26人.A項目等級為一般或良好的學(xué)生中,女生數(shù)為34人,男生數(shù)為26人.
作出如下2×2列聯(lián)表:

優(yōu)秀
一般或良好
總計
男生
26
26
52
女生
14
34
48
總計
40
60
100

則K2=≈4.514.
由于4.514>3.841,所以有95%以上的把握認(rèn)為“A項目等級為優(yōu)秀”與性別有關(guān).
(3)設(shè)“A項目等級比B項目等級高”為事件C.
記“A項目等級為良好”為事件A1,“A項目等級為優(yōu)秀”為事件A2,“B項目等級為一般”為事件B0,“B項目等級為良好”為事件B1.
于是P(A1)=(0.02+0.02)×10=0.4,P(A2)=0.4.由頻率估計概率得P(B0)==0.1,P(B1)==0.55.
因為事件Ai與Bj相互獨(dú)立,其中i=1,2,j=0,1,所以P(C)=P(A1B0+A2B0+A2B1)=0.4×0.1+0.4×0.1+0.4×0.55=0.3.
所以隨機(jī)抽取一名學(xué)生,其A項目等級比B項目等級高的概率為0.3.
5.[數(shù)據(jù)分析]下圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額y(單位:億元)的折線圖.

為了預(yù)測該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額,建立了y與時間變量t的兩個線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,…,17)建立模型①:=-30.4+13.5t;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,…,7)建立模型②:=99+17.5t.
(1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值;
(2)你認(rèn)為用哪個模型得到的預(yù)測值更可靠?并說明理由.
解:(1)利用模型①,可得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值為=-30.4+13.5×19=226.1(億元).
利用模型②,可得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值為=99+17.5×9=256.5(億元).
(2)利用模型②得到的預(yù)測值更可靠.
理由如下:
(ⅰ)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對應(yīng)的點(diǎn)沒有隨機(jī)散布在直線y=-30.4+13.5t上下,這說明利用2000年至2016年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢.2010年相對2009年的環(huán)境基礎(chǔ)設(shè)施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對應(yīng)的點(diǎn)位于一條直線的附近,這說明從2010年開始環(huán)境基礎(chǔ)設(shè)施投資額的變化規(guī)律呈線性增長趨勢,利用2010年至2016年的數(shù)據(jù)建立的線性模型=99+17.5t可以較好地描述2010年以后的環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢,因此利用模型②得到的預(yù)測值更可靠.
(ⅱ)從計算結(jié)果看,相對于2016年的環(huán)境基礎(chǔ)設(shè)施投資額220億元,由模型①得到的預(yù)測值226.1億元的增幅明顯偏低,而利用模型②得到的預(yù)測值的增幅比較合理,說明利用模型②得到的預(yù)測值更可靠.
(以上給出了2種理由,學(xué)生答出其中任意一種或其他合理理由均可得分)


英語朗讀寶
相關(guān)資料 更多
資料下載及使用幫助
版權(quán)申訴
版權(quán)申訴
若您為此資料的原創(chuàng)作者,認(rèn)為該資料內(nèi)容侵犯了您的知識產(chǎn)權(quán),請掃碼添加我們的相關(guān)工作人員,我們盡可能的保護(hù)您的合法權(quán)益。
入駐教習(xí)網(wǎng),可獲得資源免費(fèi)推廣曝光,還可獲得多重現(xiàn)金獎勵,申請 精品資源制作, 工作室入駐。
版權(quán)申訴二維碼
高考專區(qū)
歡迎來到教習(xí)網(wǎng)
  • 900萬優(yōu)選資源,讓備課更輕松
  • 600萬優(yōu)選試題,支持自由組卷
  • 高質(zhì)量可編輯,日均更新2000+
  • 百萬教師選擇,專業(yè)更值得信賴
微信掃碼注冊
qrcode
二維碼已過期
刷新

微信掃碼,快速注冊

手機(jī)號注冊
手機(jī)號碼

手機(jī)號格式錯誤

手機(jī)驗證碼 獲取驗證碼

手機(jī)驗證碼已經(jīng)成功發(fā)送,5分鐘內(nèi)有效

設(shè)置密碼

6-20個字符,數(shù)字、字母或符號

注冊即視為同意教習(xí)網(wǎng)「注冊協(xié)議」「隱私條款」
QQ注冊
手機(jī)號注冊
微信注冊

注冊成功

返回
頂部