
考點一 統(tǒng)計圖表
核心提煉
1.頻率分布直方圖中相鄰兩橫坐標之差表示組距,縱坐標表示eq \f(頻率,組距),頻率=組距×eq \f(頻率,組距).
2.在頻率分布直方圖中各小長方形的面積之和為1.
3.利用頻率分布直方圖求眾數(shù)、中位數(shù)與平均數(shù).
(1)最高的小長方形底邊中點的橫坐標即眾數(shù).
(2)中位數(shù)左邊和右邊的小長方形的面積和相等.
(3)平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標之和.
例1 (1)(多選)(2022·湖北八市聯(lián)考)某中學舉行黨史知識競賽,對全校參賽的1 000名學生的得分情況進行了統(tǒng)計,把得分數(shù)據(jù)按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5組,繪制了如圖所示的頻率分布直方圖,根據(jù)圖中信息,下列說法正確的是( )
A.圖中的x值為0.020
B.這組數(shù)據(jù)的極差為50
C.得分在80分及以上的人數(shù)為400
D.這組數(shù)據(jù)的平均數(shù)的估計值為77
答案 ACD
解析 由(0.005+x+0.035+0.030+0.010)×10=1,解得x=0.020,故選項A正確;
頻率分布直方圖無法看出這組數(shù)據(jù)的最大值和最小值,故選項B不正確;
得分在80分及以上的人數(shù)的頻率為
(0.030+0.010)×10=0.4,
故人數(shù)為1 000×0.4=400,故選項C正確;
這組數(shù)據(jù)的平均數(shù)的估計值為55×0.05+65×0.2+75×0.35+85×0.3+95×0.1=77.
故選項D正確.
(2)(多選)(2022·張家口模擬)2021年11月10日,中國和美國在聯(lián)合國氣候變化格拉斯哥大會期間發(fā)布《中美關(guān)于在21世紀20年代強化氣候行動的格拉斯哥聯(lián)合宣言》(以下簡稱《宣言》).承諾繼續(xù)共同努力,并與各方一道,加強《巴黎協(xié)定》的實施,雙方計劃建立“21世紀20年代強化氣候行動工作組”,推動兩國氣候變化合作和多邊進程.為響應(yīng)《宣言》要求,某地區(qū)統(tǒng)計了2020年該地區(qū)一次能源消費結(jié)構(gòu)比例,并規(guī)劃了2030年一次能源消費結(jié)構(gòu)比例,如圖所示,
經(jīng)測算,預(yù)估該地區(qū)2030年一次能源消費量將增長為2020年的2.5倍,預(yù)計該地區(qū)( )
A.2030年煤的消費量相對2020年減少了
B.2030年天然氣的消費量是2020年的5倍
C.2030年石油的消費量相對2020年不變
D.2030年水、核、風能的消費量是2020年的7.5倍
答案 BD
解析 設(shè)2020年該地區(qū)一次能源消費總量為a,則2020年煤的消費量為0.6a,
規(guī)劃2030年煤的消費量為a×2.5×0.3=0.75a>0.6a,故A錯誤;
2020年天然氣的消費量為0.1a,規(guī)劃2030年天然氣的消費量為a×2.5×0.2=0.5a=5×0.1a,故B正確;
2020年石油的消費量為0.2a,規(guī)劃2030年石油的消費量為a×2.5×0.2=0.5a>0.2a,故C錯誤;
2020年水、核、風能的消費量為0.1a,規(guī)劃2030年水、核、風能的消費量為a×2.5×0.3=0.75a=7.5×0.1a,故D正確.
易錯提醒 (1)對于給出的統(tǒng)計圖表,一定要結(jié)合問題背景理解圖表意義.
(2)頻率分布直方圖中縱坐標不要誤以為是頻率.
跟蹤演練1 (1)(多選)(2022·濰坊模擬)某市共青團委統(tǒng)計了甲、乙兩名同學近十期“青年大學習”答題得分情況,整理成如圖所示的莖葉圖.則下列說法中正確的是( )
A.甲得分的30%分位數(shù)是31
B.乙得分的眾數(shù)是48
C.甲得分的中位數(shù)小于乙得分的中位數(shù)
D.甲得分的極差等于乙得分的極差
答案 BCD
解析 對于A,甲得分從小到大排列為27,28,31,39,42,45,55,55,58,66,而10×30%=3,
所以甲得分的30%分位數(shù)是35,A不正確;
對于B,乙的得分中有兩個48,其余分數(shù)值均只有一個,因此,乙得分的眾數(shù)是48,B正確;
對于C,甲得分的中位數(shù)是43.5,乙得分的中位數(shù)是45,C正確;
對于D,甲得分的極差、乙得分的極差都是39,
D正確.
(2)(多選)(2022·廣東六校聯(lián)考)2021年1月11日,國家統(tǒng)計局發(fā)布2020年全國居民消費價格指數(shù)(CPI)相關(guān)數(shù)據(jù),指出2020年較好地實現(xiàn)了“居民消費價格漲幅3.5%左右”的物價調(diào)控目標.2020年全國居民消費價格漲跌幅如折線圖所示,則( )
A.從環(huán)比看,CPI由2020年11月份的環(huán)比下降0.6%在12月份轉(zhuǎn)為環(huán)比上漲0.7%
B.2020年1月份CPI同比增長最多
C.2020年CPI環(huán)比上漲的月份數(shù)比下跌的月份數(shù)多
D.2020年全年CPI同比平均比2019年上漲約2.5%
答案 ABD
解析 由圖中環(huán)比折線圖可以看出,2020年11月份的環(huán)比為-0.6%,12月份的環(huán)比為+0.7%,
所以CPI由2020年11月份的環(huán)比下降0.6%在12月份轉(zhuǎn)為環(huán)比上漲0.7%,故選項A正確;
由同比折線圖可以看出,2020年1月份的CPI同比增長5.4%,全年最高,故選項B正確;
從環(huán)比折線圖可以看出,2020年CPI環(huán)比上漲的月份數(shù)為6,環(huán)比下跌的月份數(shù)也為6,
故選項C錯誤;
由同比折線圖可知,2020年全年CPI同比平均比2019年上漲eq \f(1,12)×(5.4%+5.2%+4.3%+3.3%+2.4%+2.5%+2.7%+2.4%+1.7%+0.5%-0.5%+0.2%)≈2.5%,選項D正確.
考點二 回歸分析
核心提煉
求經(jīng)驗回歸方程的步驟
(1)依據(jù)成對樣本數(shù)據(jù)畫出散點圖,確定兩個變量具有線性相關(guān)關(guān)系(有時可省略).
(2)計算出eq \x\t(x),eq \x\t(y),eq \(a,\s\up6(^)),eq \(b,\s\up6(^)).
(3)寫出經(jīng)驗回歸方程.
例2 (2022·湖南六校聯(lián)考)為了鞏固拓展脫貧攻堅的成果,振興鄉(xiāng)村經(jīng)濟,某知名電商平臺決定為脫貧鄉(xiāng)村的特色水果開設(shè)直播帶貨專場.該特色水果的熱賣黃金時段為2022年7月10日至9月10日,為了解直播的效果和關(guān)注度,該電商平臺統(tǒng)計了已直播的2022年7月10日至7月14日時段中的相關(guān)數(shù)據(jù),這5天的第x天到該電商平臺專營店購物的人數(shù)y(單位:萬人)的數(shù)據(jù)如下表:
(1)依據(jù)表中的統(tǒng)計數(shù)據(jù),請判斷該電商平臺直播的第x天與到該電商平臺專營店購物的人數(shù)y(單位:萬人)是否具有較高的線性相關(guān)程度?(注:若0.30.75,
所以該電商平臺直播的第x天與到該電商平臺專營店購物的人數(shù)y具有較高的線性相關(guān)程度.
(2)由(1)知可用一元線性回歸模型擬合購買人數(shù)y與直播的第x天之間的關(guān)系.
eq \(b,\s\up6(^))=eq \f(\i\su(i=1,5, )?xi-\x\t(x)??yi-\x\t(y)?,\i\su(i=1,5, )?xi-\x\t(x)?2)=eq \f(64,10)=6.4,
則eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=90-6.4×3=70.8,
所以eq \(y,\s\up6(^))=6.4x+70.8,
令x=38,可得eq \(y,\s\up6(^))=6.4×38+70.8=314(萬人).
預(yù)測從2022年7月10日起的第38天到該專營店購物的人數(shù)為314萬人.
易錯提醒 (1)樣本點不一定在經(jīng)驗回歸直線上,但點(eq \x\t(x),eq \x\t(y))一定在經(jīng)驗回歸直線上.
(2)求eq \(b,\s\up6(^))時,靈活選擇公式,注意公式的推導(dǎo)和記憶.
(3)利用樣本相關(guān)系數(shù)判斷相關(guān)性強弱時,看|r|的大小,而不是r的大小.
(4)區(qū)分樣本相關(guān)系數(shù)r與決定系數(shù)R2.
(5)通過經(jīng)驗回歸方程求的都是估計值,而不是真實值.
跟蹤演練2 (1)(多選)(2022·汕頭模擬)如圖所示,5個(x,y)數(shù)據(jù),去掉D(3,10)后,下列說法正確的是( )
A.樣本相關(guān)系數(shù)r變大
B.殘差平方和變大
C.決定系數(shù)R2變小
D.解釋變量x與響應(yīng)變量y的相關(guān)性變強
答案 AD
解析 由散點圖知,去掉離群點D后,x與y的相關(guān)性變強,且為正相關(guān),
所以樣本相關(guān)系數(shù)r的值變大,決定系數(shù)R2的值變大,殘差平方和變?。?br>(2)(多選)(2022·重慶模擬)某種產(chǎn)品的價格x(單位:元/kg)與需求量y(單位:kg)之間的對應(yīng)數(shù)據(jù)如下表所示:
根據(jù)表中的數(shù)據(jù)可得經(jīng)驗回歸方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+14.4,則下列正確的是( )
A.樣本相關(guān)系數(shù)r>0
B.eq \(b,\s\up6(^))=-0.32
C.若該產(chǎn)品價格為35元/kg,則日需求量大約為3.2 kg
D.第四個樣本點對應(yīng)的殘差為-0.4
答案 BCD
解析 對A,B,由表中的數(shù)據(jù)可知,
eq \x\t(x)=eq \f(10+15+20+25+30,5)=20,
eq \x\t(y)=eq \f(11+10+8+6+5,5)=8,
將eq \x\t(x),eq \x\t(y)代入eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+14.4,
得eq \(b,\s\up6(^))=-0.32,所以A選項錯誤,B選項正確;
對C,將x=35代入eq \(y,\s\up6(^))=-0.32x+14.4得eq \(y,\s\up6(^))=3.2,
所以日需求量大約為3.2 kg,
所以C選項正確;
對D,第四個樣本點對應(yīng)的殘差為y4-eq \(y,\s\up6(^))4=6-(-0.32×25+14.4)=-0.4,所以D選項正確.
考點三 獨立性檢驗
核心提煉
獨立性檢驗的一般步驟
(1)根據(jù)樣本數(shù)據(jù)列2×2列聯(lián)表.
(2)根據(jù)公式χ2=eq \f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),計算χ2的值.
(3)查表比較χ2與臨界值的大小關(guān)系,作統(tǒng)計判斷.χ2越大,對應(yīng)假設(shè)事件H0成立(兩類變量相互獨立)的概率越小,H0不成立的概率越大.
例3 (2022·濟寧模擬)為提高教育教學質(zhì)量,越來越多的高中學校采用寄宿制的封閉管理模式.某校對高一新生是否適應(yīng)寄宿生活做調(diào)查,從高一新生中隨機抽取了100人,其中男生占總?cè)藬?shù)的40%,且只有20%的男生表示自己不適應(yīng)寄宿生活,女生中不適應(yīng)寄宿生活的人數(shù)占總?cè)藬?shù)的32%.學校為了考查學生對寄宿生活適應(yīng)與否是否與性別有關(guān),構(gòu)建了如下2×2列聯(lián)表:
(1)請將2×2列聯(lián)表補充完整,并依據(jù)小概率值α=0.010的獨立性檢驗,是否可以推斷適應(yīng)寄宿生活與否與性別有關(guān);
(2)從男生中以“是否適應(yīng)寄宿生活”為標準采用分層隨機抽樣的方法抽取10人,再從這10人中隨機抽取2人,若所選2名學生中的“不適應(yīng)寄宿生活”人數(shù)為X,求隨機變量X的分布列及均值.
附:χ2=eq \f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),其中n=a+b+c+d.
解 (1)補充列聯(lián)表如下:
零假設(shè)為H0:適應(yīng)寄宿生活與否與性別無關(guān).
根據(jù)列聯(lián)表中的數(shù)據(jù)得,
χ2=eq \f(100×?8×28-32×32?2,40×60×40×60)≈11.111>6.635=x0.010,
根據(jù)小概率值α=0.010的獨立性檢驗,推斷H0不成立,可以推斷適應(yīng)寄宿生活與否與性別有關(guān)聯(lián).
(2)由題意知,抽取的10人中,有2人不適應(yīng)寄宿生活,有8人適應(yīng)寄宿生活,
故隨機變量X的取值可以是0,1,2,
P(X=0)=eq \f(C\\al(2,8),C\\al(2,10))=eq \f(28,45),
P(X=1)=eq \f(C\\al(1,8)C\\al(1,2),C\\al(2,10))=eq \f(16,45),
P(X=2)=eq \f(C\\al(2,2),C\\al(2,10))=eq \f(1,45),
隨機變量X的分布列為
因此,E(X)=0×eq \f(28,45)+1×eq \f(16,45)+2×eq \f(1,45)=eq \f(2,5).
易錯提醒 (1)χ2越大兩分類變量無關(guān)的可能性越小,推斷犯錯誤的概率越小,通過表格查得無關(guān)的可能性.
(2)在犯錯誤的概率不大于0.01的前提下認為兩個變量有關(guān),并不是指兩個變量無關(guān)的可能性為0.01.
跟蹤演練3 (2022·河北聯(lián)考)《2021新銳品牌數(shù)字化運營白皮書》中,我國提出了新銳品牌的概念,全稱是國貨新銳品牌.對這個名稱進行拆解:國貨、新、銳.新有兩個層面,一是針對企業(yè)本身,指2011年后成立的品牌.二是針對消費者本身,開拓了新的消費場景(需求),形成了細分化的品類.銳:是在短期內(nèi)實現(xiàn)大大高于傳統(tǒng)品牌的爆發(fā)式增長,并且占據(jù)了一定的消費者心智.如圖是11月份中國某信息網(wǎng)發(fā)布的我國A市2021年上半年新銳品牌人群用戶(新銳品牌人群,指在指定周期內(nèi)瀏覽新銳品牌相關(guān)內(nèi)容以及商品詳情頁的人群)性別分析數(shù)據(jù).A市從購買家電類新銳品牌人群中隨機調(diào)查了100位男性顧客和100位女性顧客,統(tǒng)計出每位顧客購買家電消費金額,根據(jù)這些數(shù)據(jù)得到如圖所示的頻數(shù)分布表:
(1)若以我國A市2021年上半年新銳品牌人群用戶性別分析數(shù)據(jù)作為A市抽取新銳品牌人群性別概率,從A市新銳品牌人群中隨機抽取四人,X為四人中男性的人數(shù),求X的概率分布列和均值;
(2)根據(jù)A市統(tǒng)計購買家電消費金額數(shù)據(jù)頻數(shù)分布表,完成下列2×2列聯(lián)表,并依據(jù)小概率值α=0.010的獨立性檢驗,分析購買家電類新銳品牌人群消費金額千元以上是否與性別有關(guān)?
附:χ2=eq \f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),n=a+b+c+d.
解 (1)若以我國A市2021年上半年新銳品牌人群用戶性別比例數(shù)據(jù)作為A市抽取新銳品牌人群性別概率,則A市新銳品牌人群中隨機抽取一人為男性的概率為75%,為女性的概率為25%,且X服從二項分布,
X的所有可能取值為0,1,2,3,4,
P(X=0)=Ceq \\al(0,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))4=eq \f(1,256),
P(X=1)=Ceq \\al(1,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))1×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))3=eq \f(3,64),
P(X=2)=Ceq \\al(2,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))2×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))2=eq \f(27,128),
P(X=3)=Ceq \\al(3,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))3×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))1=eq \f(27,64),
P(X=4)=Ceq \\al(4,4)×eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))4=eq \f(81,256),
得X分布列為
E(X)=4×eq \f(3,4)=3.
(2)根據(jù)所給數(shù)據(jù),可得2×2列聯(lián)表:
零假設(shè)為H0:購買家電類新銳品牌人群消費金額千元以上與性別無關(guān).
根據(jù)列聯(lián)表得χ2=eq \f(200×?80×40-20×60?2,100×100×140×60)≈9.524>6.635=x0.010,
根據(jù)小概率值α=0.010的獨立性檢驗,推斷H0不成立,即認為購買家電類新銳品牌人群消費金額千元以上與性別有關(guān).
專題強化練
一、單項選擇題
1.某公司2022年1月至7月空調(diào)銷售完成情況如圖,如7月份銷售量是190臺,若月份為x,銷售量為y,由統(tǒng)計數(shù)據(jù)(xi,yi)(i=1,2,…,7)得到散點圖,下面四個經(jīng)驗回歸方程類型中最適合作為銷售量y和月份x的經(jīng)驗回歸方程類型的是( )
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+bln x
答案 B
解析 由散點圖分布可知,散點圖分布在一個二次函數(shù)的圖象附近,因此,最適合作為銷售量y和月份x的經(jīng)驗回歸方程類型的是y=a+bx2.
2.(2022·全國甲卷)某社區(qū)通過公益講座以普及社區(qū)居民的垃圾分類知識.為了解講座效果,隨機抽取10位社區(qū)居民,讓他們在講座前和講座后各回答一份垃圾分類知識問卷,這10位社區(qū)居民在講座前和講座后問卷答題的正確率如圖,則( )
A.講座前問卷答題的正確率的中位數(shù)小于70%
B.講座后問卷答題的正確率的平均數(shù)大于85%
C.講座前問卷答題的正確率的標準差小于講座后正確率的標準差
D.講座后問卷答題的正確率的極差大于講座前正確率的極差
答案 B
解析 對于A,講座前問卷答題的正確率的中位數(shù)是eq \f(70%+75%,2)=72.5%,所以A錯誤;
對于B,講座后問卷答題的正確率分別是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均數(shù)顯然大于85%,所以B正確;
對于C,由題圖可知,講座前問卷答題的正確率波動較大,講座后問卷答題的正確率波動較小,所以講座前問卷答題的正確率的標準差大于講座后問卷答題的正確率的標準差,所以C錯誤;
對于D,講座前問卷答題的正確率的極差是95%-60%=35%,講座后問卷答題的正確率的極差是100%-80%=20%,所以講座前問卷答題的正確率的極差大于講座后問卷答題的正確率的極差,所以D錯誤.故選B.
3.(2022·濟南模擬)某學校于3月12日組織師生舉行植樹活動,購買垂柳、銀杏、側(cè)柏、海桐四種樹苗共計1 200棵,比例如圖所示.高一、高二、高三報名參加植樹活動的人數(shù)分別為600,400,200,若每種樹苗均按各年級報名人數(shù)的比例進行分配,則高三年級應(yīng)分得側(cè)柏的數(shù)量為( )
A.34 B.46 C.50 D.70
答案 C
解析 由扇形統(tǒng)計圖知,購買的1 200棵樹苗中,側(cè)柏的數(shù)量為1 200×25%=300,
依題意知,高一、高二、高三分到的側(cè)柏的棵數(shù)比為600∶400∶200=3∶2∶1,所以高三年級應(yīng)分得側(cè)柏的數(shù)量為eq \f(1,3+2+1)×300=50.
4.(2022·運城模擬)從非洲蔓延到東南亞的蝗蟲災(zāi)害嚴重威脅了國際農(nóng)業(yè)生產(chǎn),影響了人民生活.世界性與區(qū)域性溫度的異常、旱澇頻繁發(fā)生給蝗災(zāi)發(fā)生創(chuàng)造了機會.已知蝗蟲的產(chǎn)卵量y與溫度x的關(guān)系可以用模型y=(其中e為自然對數(shù)的底數(shù))擬合,設(shè)z=ln y,其變換后得到一組數(shù)據(jù):
由上表可得經(jīng)驗回歸方程z=0.2x+a,則當x=60時,蝗蟲的產(chǎn)卵量y的估計值為( )
A.e6 B.10 C.6 D.e10
答案 D
解析 由表格數(shù)據(jù)知,
eq \x\t(x)=eq \f(1,5)×(20+23+25+27+30)=25,
eq \x\t(z)=eq \f(1,5)×(2+2.4+3+3+4.6)=3,
∵(eq \x\t(x),eq \x\t(z))滿足z=0.2x+a,
得a=3-0.2×25=-2,
∴z=0.2x-2,即ln y=0.2x-2,
∴y=e0.2x-2,
∴當x=60時,y=e10,
故當x=60時,蝗蟲的產(chǎn)卵量y的估計值為e10.
5.(2022·綿陽模擬)某車間從生產(chǎn)的一批產(chǎn)品中隨機抽取了1 000個零件進行一項質(zhì)量指標的檢測,整理檢測結(jié)果得此項質(zhì)量指標的頻率分布直方圖如圖所示,則下列結(jié)論錯誤的是( )
A.a(chǎn)=0.005
B.估計這批產(chǎn)品該項質(zhì)量指標的眾數(shù)為45
C.估計這批產(chǎn)品該項質(zhì)量指標的中位數(shù)為60
D.從這批產(chǎn)品中隨機選取1個零件,其質(zhì)量指標在[50,70)的概率約為0.5
答案 C
解析 (a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,故A正確;
頻率最大的一組為第二組,中間值為eq \f(40+50,2)=45,
所以眾數(shù)為45,故B正確;
質(zhì)量指標大于等于60的有兩組,
頻率之和為(0.020+0.010)×10=0.30
D.2023年的借閱量一定不少于6.12萬冊
答案 ABC
解析 對于A,
因為eq \x\t(x)=eq \f(1,5)×(1+2+3+4+5)=3,
eq \x\t(y)=eq \f(1,5)×(4.9+5.1+5.5+5.7+5.8)=5.4,
所以5.4=0.24×3+eq \(a,\s\up6(^)),得eq \(a,\s\up6(^))=4.68,所以A正確;
對于B,因為5×75%=3.75,所以借閱量4.9,5.1,5.5,5.7,5.8的75%分位數(shù)為5.7,所以B正確;
對于C,因為0.24>0,所以y與x的樣本相關(guān)系數(shù)r>0,
所以C正確;
對于D,由選項A可知經(jīng)驗回歸方程為eq \(y,\s\up6(^))=0.24x+4.68,
當x=6時,eq \(y,\s\up6(^))=0.24×6+4.68=6.12,所以2023年的借閱量約為6.12萬冊,而且這只是預(yù)測值,不能確定2023年的借閱量一定是多少,所以D錯誤.
9.(2022·山東聯(lián)考)為了解高中生選科時是否選物理與數(shù)學成績之間的關(guān)系,某教研機構(gòu)隨機抽取了50名高中生,通過問卷調(diào)查,得到以下數(shù)據(jù):
由以上數(shù)據(jù),計算得到χ2=eq \f(50×?13×20-10×7?2,23×27×20×30)≈4.844,根據(jù)臨界值表,以下說法正確的是( )
參考數(shù)據(jù):
A.依據(jù)小概率值α=0.05的獨立性檢驗認為是否選擇物理與數(shù)學成績有關(guān)
B.在犯錯誤的概率不超過0.01的前提下,認為是否選擇物理與數(shù)學成績無關(guān)
C.95%的數(shù)學成績優(yōu)異的同學選擇物理
D.若表格中的所有數(shù)據(jù)都擴大為原來的10倍,在相同條件下,結(jié)論不會發(fā)生變化
答案 AB
解析 因為4.844>3.841=x0.05,
所以依據(jù)小概率值α=0.05的獨立性檢驗認為是否選擇物理與數(shù)學成績有關(guān);
因為4.84410.828,故結(jié)論發(fā)生變化.
10.(2022·連云港模擬)一組數(shù)據(jù)x1,x2,…,x10是公差為-1的等差數(shù)列,若去掉首末兩項x1,x10后,則( )
A.平均數(shù)變大 B.中位數(shù)沒變
C.方差變小 D.極差沒變
答案 BC
解析 由題意可知,對于選項A,原數(shù)據(jù)的平均數(shù)為eq \x\t(x)=eq \f(1,10)(x1+x2+…+x10)=eq \f(1,10)×5(x5+x6)=eq \f(1,2)(x5+x6),去掉x1,x10后的平均數(shù)為
eq \x\t(x)′=eq \f(1,8)(x2+x3+…+x9)=eq \f(1,8)×4(x5+x6)=eq \f(1,2)(x5+x6)=eq \x\t(x).
即平均數(shù)不變,故選項A錯誤;
對于選項B,原數(shù)據(jù)的中位數(shù)為eq \f(1,2)(x5+x6),去掉x1,x10后的中位數(shù)仍為eq \f(1,2)(x5+x6),即中位數(shù)沒變,故選項B正確;
對于選項C,設(shè)公差為d,則原數(shù)據(jù)的方差為
s2=eq \f(1,10)eq \b\lc\{\rc\ (\a\vs4\al\c1(\b\lc\[\rc\](\a\vs4\al\c1(x1-\f(1,2)?x5+x6?))2+\b\lc\[\rc\](\a\vs4\al\c1(x2-\f(1,2)?x5+x6?))2))eq \b\lc\ \rc\}(\a\vs4\al\c1(+…+\b\lc\[\rc\](\a\vs4\al\c1(x10-\f(1,2)?x5+x6?))2))
=eq \f(1,10)eq \b\lc\[\rc\ (\a\vs4\al\c1(\b\lc\(\rc\)(\a\vs4\al\c1(-\f(9,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(-\f(7,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(-\f(5,2)d))2+))eq \b\lc\ \rc\ (\a\vs4\al\c1(\b\lc\(\rc\)(\a\vs4\al\c1(-\f(3,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(-\f(1,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(1,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(3,2)d))2+))
eq \b\lc\ \rc\](\a\vs4\al\c1(\b\lc\(\rc\)(\a\vs4\al\c1(\f(5,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(7,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(9,2)d))2))=eq \f(33,4),
去掉x1,x10后的方差為
s′2=eq \f(1,8)eq \b\lc\{\rc\ (\a\vs4\al\c1(\b\lc\[\rc\](\a\vs4\al\c1(x2-\f(1,2)?x5+x6?))2+\b\lc\[\rc\](\a\vs4\al\c1(x3-\f(1,2)?x5+x6?))2))eq \b\lc\ \rc\}(\a\vs4\al\c1(+…+\b\lc\[\rc\](\a\vs4\al\c1(x9-\f(1,2)?x5+x6?))2))
=eq \f(1,8)eq \b\lc\[\rc\ (\a\vs4\al\c1(\b\lc\(\rc\)(\a\vs4\al\c1(-\f(7,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(-\f(5,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(-\f(3,2)d))2+))eq \b\lc\ \rc\](\a\vs4\al\c1(\b\lc\(\rc\)(\a\vs4\al\c1(-\f(1,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(1,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(3,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(5,2)d))2+\b\lc\(\rc\)(\a\vs4\al\c1(\f(7,2)d))2))
=eq \f(21,4),
即方差變小,故選項C正確;
對于選項D,原數(shù)據(jù)的極差為
x1-x10=-9d=9,
去掉x1,x10后的極差為x2-x9=-7d=7,
即極差變小,故選項D錯誤.
三、填空題
11.某工廠為研究某種產(chǎn)品的產(chǎn)量x(噸)與所需某種原材料的質(zhì)量y(噸)的相關(guān)性,在生產(chǎn)過程中收集4組對應(yīng)數(shù)據(jù)(x,y),如表所示.(殘差=觀測值-預(yù)測值)
根據(jù)表中數(shù)據(jù),得出y關(guān)于x的經(jīng)驗回歸方程為eq \(y,\s\up6(^))=0.7x+eq \(a,\s\up6(^)).據(jù)此計算出在樣本(4,3)處的殘差為-0.15,則表中m的值為________.
答案 4.5
解析 因為樣本(4,3)處的殘差為-0.15,
即y-eq \(y,\s\up6(^))=3-(0.7×4+eq \(a,\s\up6(^)))=-0.15,所以eq \(a,\s\up6(^))=0.35,
所以經(jīng)驗回歸方程為eq \(y,\s\up6(^))=0.7x+0.35,
因為eq \x\t(x)=eq \f(3+4+5+6,4)=4.5,
eq \x\t(y)=eq \f(2.5+3+4+m,4)=eq \f(9.5+m,4),
又樣本中心點(eq \x\t(x),eq \x\t(y))在經(jīng)驗回歸直線上,
所以eq \f(9.5+m,4)=0.7×4.5+0.35,解得m=4.5.
12.某校抽取100名學生做體能測試,其中百米測試中,成績?nèi)拷橛?3秒與18秒之間,將測試結(jié)果分成五組:第一組[13,14),第二組[14,15),…,第五組[17,18].如圖是按上述分組方法得到的頻率分布直方圖,若成績低于a即為優(yōu)秀,如果優(yōu)秀的人數(shù)為14,則a的估計值是________.
答案 14.5
解析 優(yōu)秀人數(shù)所占的頻率為eq \f(14,100)=0.14,
測試結(jié)果位于[13,14)的頻率為0.060.14,
所以a∈(14,15),
由題意可得0.06+(a-14)×0.16=0.14,
解得a=14.5.
四、解答題
13.(2021·全國乙卷)某廠研制了一種生產(chǎn)高精產(chǎn)品的設(shè)備,為檢驗新設(shè)備生產(chǎn)產(chǎn)品的某項指標有無提高,用一臺舊設(shè)備和一臺新設(shè)備各生產(chǎn)了10件產(chǎn)品,得到各件產(chǎn)品該項指標數(shù)據(jù)如下:
舊設(shè)備和新設(shè)備生產(chǎn)產(chǎn)品的該項指標的樣本均值分別記為eq \x\t(x)和eq \x\t(y),樣本方差分別記為seq \\al(2,1)和seq \\al(2,2).
(1)求eq \x\t(x),eq \x\t(y),seq \\al(2,1),seq \\al(2,2);
(2)判斷新設(shè)備生產(chǎn)產(chǎn)品的該項指標的均值較舊設(shè)備是否有顯著提高(如果eq \x\t(y)-eq \x\t(x)≥2eq \r(\f(s\\al(2,1)+s\\al(2,2),10)),則認為新設(shè)備生產(chǎn)產(chǎn)品的該項指標的均值較舊設(shè)備有顯著提高,否則不認為有顯著提高).
解 (1)由表格中的數(shù)據(jù)易得eq \x\t(x)=eq \f(-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.3,10)+10.0=10.0,
eq \x\t(y)=eq \f(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5,10)+10.0=10.3,
seq \\al(2,1)=eq \f(1,10)×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,
seq \\al(2,2)=eq \f(1,10)×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.
(2)由(1)中數(shù)據(jù)可得eq \x\t(y)-eq \x\t(x)=10.3-10.0=0.3,而2eq \r(\f(s\\al(2,1)+s\\al(2,2),10))=eq \r(\f(2,5)?s\\al(2,1)+s\\al(2,2)?)=eq \r(0.030 4),顯然有eq \x\t(y)-eq \x\t(x)>2eq \r(\f(s\\al(2,1)+s\\al(2,2),10))成立,所以認為新設(shè)備生產(chǎn)產(chǎn)品的該項指標的均值較舊設(shè)備有顯著提高.
14.(2022·廣東大聯(lián)考)中國在第75屆聯(lián)合國大會上承諾,將采取更加有力的政策和措施,力爭于2030年之前使二氧化碳的排放達到峰值,努力爭取2060年之前實現(xiàn)碳中和(簡稱“雙碳目標”),此舉展現(xiàn)了我國應(yīng)對氣候變化的堅定決心,預(yù)示著中國經(jīng)濟結(jié)構(gòu)和經(jīng)濟社會運轉(zhuǎn)方式將產(chǎn)生深刻變革,極大促進我國產(chǎn)業(yè)鏈的清潔化和綠色化.新能源汽車、電動汽車是重要的戰(zhàn)略新興產(chǎn)業(yè),對于實現(xiàn)“雙碳目標”具有重要的作用.為了解某一地區(qū)純電動汽車銷售情況,一機構(gòu)根據(jù)統(tǒng)計數(shù)據(jù),用最小二乘法得到電動汽車銷量y(單位:萬臺)關(guān)于x(年份)的經(jīng)驗回歸方程為eq \(y,\s\up6(^))=4.7x-9 459.2,且銷量y的方差為seq \\al(2,y)=eq \f(254,5),年份x的方差為seq \\al(2,x)=2.
(1)求y與x的樣本相關(guān)系數(shù)r,并據(jù)此判斷電動汽車銷量y與年份x的相關(guān)程度;
(2)該機構(gòu)還調(diào)查了該地區(qū)90位購車車主的性別與購車種類情況,得到的數(shù)據(jù)如下表:
依據(jù)小概率值α=0.025的獨立性檢驗,能否認為購買電動汽車與車主性別有關(guān);
(3)在購買電動汽車的車主中按照性別進行分層隨機抽樣抽取7人,再從這7人中隨機抽取3人,記這3人中,男性的人數(shù)為X,求X的分布列和均值.
參考數(shù)據(jù):eq \r(5×127)=eq \r(635)≈25.
參考公式:①經(jīng)驗回歸方程:eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),其中eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )?xi-\x\t(x)??yi-\x\t(y)?,\i\su(i=1,n, )?xi-\x\t(x)?2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
②樣本相關(guān)系數(shù):r=eq \f(\i\su(i=1,n, )?xi-\x\t(x)??yi-\x\t(y)?,\r(\i\su(i=1,n, )?xi-\x\t(x)?2\i\su(i=1,n, )?yi-\x\t(y)?2)),若r>0.9,則可判斷y與x線性相關(guān)程度較強.
③χ2=eq \f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),其中n=a+b+c+d.
附表:
解 (1)樣本相關(guān)系數(shù)為
r=eq \f(\i\su(i=1,n, )?xi-\x\t(x)??yi-\x\t(y)?,\r(\i\su(i=1,n, )?xi-\x\t(x)?2\i\su(i=1,n, )?yi-\x\t(y)?2))
=eq \f(\i\su(i=1,n, )?xi-\x\t(x)??yi-\x\t(y)?,\i\su(i=1,n, )?xi-\x\t(x)?2)·eq \f(\r(\i\su(i=1,n, )?xi-\x\t(x)?2),\r(\i\su(i=1,n, )?yi-\x\t(y)?2))
=eq \(b,\s\up6(^))·eq \f(\r(ns\\al(2,x)),\r(ns\\al(2,y)))=eq \(b,\s\up6(^))·eq \f(\r(s\\al(2,x)),\r(s\\al(2,y)))
=4.7×eq \r(\f(10,254))=eq \f(47,\r(10)×\r(254))=eq \f(47,2\r(635))
≈eq \f(47,50)=0.94>0.9,
故y與x線性相關(guān)程度較強.
(2)零假設(shè)為H0:購買電動汽車與車主性別無關(guān).
根據(jù)列聯(lián)表得χ2=eq \f(n?ad-bc?2,?a+b??c+d??a+c??b+d?)
=eq \f(90×?39×15-30×6?2,45×45×69×21)≈5.031>5.024=x0.025.
根據(jù)小概率值α=0.025的獨立性檢驗,推斷H0不成立,即認為購買電動汽車與車主性別有關(guān).
(3)抽樣比為eq \f(7,21)=eq \f(1,3),男性車主選取2人,女性車主選取5人,則X的可能取值為0,1,2,
故P(X=0)=eq \f(C\\al(3,5),C\\al(3,7))=eq \f(2,7),
P(X=1)=eq \f(C\\al(1,2)C\\al(2,5),C\\al(3,7))=eq \f(4,7),
P(X=2)=eq \f(C\\al(2,2)C\\al(1,5),C\\al(3,7))=eq \f(1,7).
故X的分布列為
∴E(X)=0×eq \f(2,7)+1×eq \f(4,7)+2×eq \f(1,7)=eq \f(6,7).日期
7月10日
7月11日
7月12日
7月13日
7月14日
第x天
1
2
3
4
5
人數(shù)y(單位:萬人)
75
84
93
98
100
x
10
15
20
25
30
y
11
10
8
6
5
不適應(yīng)寄宿生活
適應(yīng)寄宿生活
合計
男生
女生
合計
α
0.025
0.010
0.001
xα
5.024
6.635
10.828
不適應(yīng)寄宿生活
適應(yīng)寄宿生活
合計
男生
8
32
40
女生
32
28
60
合計
40
60
100
X
0
1
2
P
eq \f(28,45)
eq \f(16,45)
eq \f(1,45)
消費金額(元)
[0,100]
(100,1 000]
(1 000,5 000]
(5 000,10 000]
(10 000,+∞)
女性顧客人數(shù)
50
30
10
6
4
男性顧客人數(shù)
20
40
24
10
6
不超千元
千元以上
合計
女性顧客
男性顧客
合計
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
X
0
1
2
3
4
P
eq \f(1,256)
eq \f(3,64)
eq \f(27,128)
eq \f(27,64)
eq \f(81,256)
不超千元
千元以上
合計
女性顧客
80
20
100
男性顧客
60
40
100
合計
140
60
200
x
20
23
25
27
30
z
2
2.4
3
3
4.6
年份
2018
2019
2020
2021
2022
年份代碼x
1
2
3
4
5
年借閱量y(萬冊)
4.9
5.1
5.5
5.7
5.8
選物理
不選物理
數(shù)學成績優(yōu)異
20
7
數(shù)學成績一般
10
13
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
x
3
4
5
6
y
2.5
3
4
m
舊設(shè)備
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新設(shè)備
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
購買非電動車
購買電動車
總計
男性
39
6
45
女性
30
15
45
總計
69
21
90
α
0.10
0.05
0.025
0.010
0.001
xα
2.706
3.841
5.024
6.635
10.828
X
0
1
2
P
eq \f(2,7)
eq \f(4,7)
eq \f(1,7)
這是一份高考數(shù)學一輪復(fù)習第10章第3課時成對數(shù)據(jù)的統(tǒng)計分析學案,共32頁。
這是一份高考數(shù)學一輪復(fù)習第9章第3節(jié)成對數(shù)據(jù)的統(tǒng)計分析學案,共17頁。學案主要包含了教材概念·結(jié)論·性質(zhì)重現(xiàn),基本技能·思想·活動經(jīng)驗等內(nèi)容,歡迎下載使用。
這是一份【新高考】2023年高考數(shù)學二輪復(fù)習精講精練學案——第22講 統(tǒng)計初步及成對數(shù)據(jù)的統(tǒng)計分析(原卷版+解析版),文件包含第二十二講統(tǒng)計初步及成對數(shù)據(jù)的統(tǒng)計分析解析版docx、第二十二講統(tǒng)計初步及成對數(shù)據(jù)的統(tǒng)計分析原卷版docx等2份學案配套教學資源,其中學案共86頁, 歡迎下載使用。
注冊成功