
?第1講 統(tǒng)計(jì)和統(tǒng)計(jì)案例
目錄
第一部分:知識(shí)強(qiáng)化
第二部分:重難點(diǎn)題型突破
突破一:隨機(jī)數(shù)表法
突破二:分層抽樣
突破三:頻率分布直方圖
突破四:平均數(shù),眾數(shù),中位數(shù),方差,標(biāo)準(zhǔn)差
突破五:總體百分位數(shù)
突破六:回歸直線方程
突破七:相關(guān)系數(shù)
突破八:殘差
突破九:非線性回歸
突破十:獨(dú)立性檢驗(yàn)
第三部分:沖刺重難點(diǎn)特訓(xùn)
第一部分:知識(shí)強(qiáng)化
1、總體平均數(shù)與樣本平均數(shù)
(1)總體平均數(shù)
一般地,總體中有個(gè)個(gè)體,它們的變量值分別為,,…,
則稱為總體均值,又稱總體平均數(shù).
(2)加權(quán)平均數(shù)
如果總體的個(gè)變量值中,不同的值共有()個(gè),不妨記為,,…,,其中出現(xiàn)的頻數(shù)(),則總體均值還可以寫成加權(quán)平均數(shù)的形式:.
(3)樣本平均數(shù)
如果從總體中抽取一個(gè)容量為的樣本,它們的變量值分別為,,…,
則稱為樣本均值,又稱樣本平均數(shù).
2、分層隨機(jī)抽樣的步驟
①根據(jù)己經(jīng)掌握的信息,將總體分成互不相交的層;
②根據(jù)總體中的個(gè)體數(shù)和樣本量計(jì)算抽樣比;
③確定第層應(yīng)該抽取的個(gè)體數(shù)目(為第層所包含的個(gè)體數(shù)),使得各之和為;
④在各個(gè)層中,按步驟③中確定的數(shù)目在各層中隨機(jī)抽取個(gè)體,合在一起得到容量為的樣本.
3、繪制頻率分布直方圖的步驟及頻率分布直方圖的性質(zhì)
①求極差,即一組數(shù)據(jù)中的最大值與最小值的差.
②決定組距與組數(shù).組距與組數(shù)的確定沒有固定的標(biāo)準(zhǔn),一般數(shù)據(jù)的個(gè)數(shù)越多,所分組數(shù)越多.當(dāng)樣本容量不超過100時(shí),常分成5~12組.為方便起見,一般取等長組距,并且組距應(yīng)力求“取整”.
③將數(shù)據(jù)分組.
④列頻率分布表.計(jì)算各小組的頻率,第組的頻率是.
⑤畫頻率分布直方圖.其中橫軸表示分組,縱軸表示.實(shí)際上就是頻率分布直方圖中各小長方形的高度,它反映了各組樣本觀測數(shù)據(jù)的疏密程度.
4、第百分位數(shù)
(1)第百分位數(shù)的概念
一般地,一組數(shù)據(jù)的第百分位數(shù)是這樣一個(gè)值,它使得這組數(shù)據(jù)中至少有的數(shù)據(jù)小于或等于這個(gè)值,且至少有的數(shù)據(jù)大于或等于這個(gè)值.
(2)計(jì)算第p百分位數(shù)的步驟
第1步,按從小到大排列原始數(shù)據(jù).
第2步,計(jì)算.
第3步,若不是整數(shù),而大于的比鄰整數(shù)為,則第百分位數(shù)為第項(xiàng)數(shù)據(jù);
若是整數(shù),則第百分位數(shù)為第項(xiàng)與第項(xiàng)數(shù)據(jù)的平均數(shù).
5、總體集中趨勢的估計(jì)
(1)平均數(shù)
①定義:一組數(shù)據(jù)的和與這組數(shù)據(jù)的個(gè)數(shù)的商.數(shù)據(jù),,的平均數(shù)為.
②特征:平均數(shù)對(duì)數(shù)據(jù)有“取齊”的作用,代表該組數(shù)據(jù)的平均水平,任何一個(gè)數(shù)據(jù)的改變都會(huì)引起平均數(shù)的變化,這是眾數(shù)和中位數(shù)都不具有的性質(zhì).所以與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中極端值的影響較大,使平均數(shù)在估計(jì)總體時(shí)的可靠性降低.
(2)眾數(shù)
①定義:一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)(即頻率分布最大值所對(duì)應(yīng)的樣本數(shù)據(jù))稱為這組數(shù)據(jù)的眾數(shù)。
②特征:一組數(shù)據(jù)的眾數(shù)可能不止一個(gè),也可能沒有,反映了該組數(shù)據(jù)的集中趨勢.
(3)中位數(shù)
①定義:一組數(shù)據(jù)按從小到大(或從大到?。┑捻樞蚺懦梢涣?,處于最中間的一個(gè)數(shù)據(jù)(當(dāng)數(shù)據(jù)個(gè)數(shù)是奇數(shù)時(shí))或最中間兩個(gè)數(shù)據(jù)的平均數(shù)(當(dāng)數(shù)據(jù)個(gè)數(shù)是偶數(shù)時(shí))稱為這組數(shù)據(jù)的中位數(shù).
②特征:一組數(shù)據(jù)的中位數(shù)是唯一的,反映了該組數(shù)據(jù)的集中趨勢.在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積相等.
6、在頻率分布直方圖中平均數(shù),中位數(shù),眾數(shù)的估計(jì)值
(1)平均數(shù):在頻率分布直方圖中,樣本平均數(shù)可以用每個(gè)小矩形底邊中點(diǎn)的橫坐標(biāo)與小矩形的面積的乘積之和近似代替.
(2)中位數(shù):在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等.
(3)眾數(shù):眾數(shù)是最高小矩形底邊的中點(diǎn)所對(duì)應(yīng)的數(shù)據(jù).
7、總體離散程度的估計(jì)
(1)極差
一組數(shù)據(jù)中的最大值與最小值的差稱為極差.
(2)方差與標(biāo)準(zhǔn)差
一組數(shù)據(jù),,,,用表示這組數(shù)據(jù)的平均數(shù),
則這組數(shù)據(jù)的方差:;
標(biāo)準(zhǔn)差:
(3)總體方差和標(biāo)準(zhǔn)差
如果總體中所有個(gè)體的變量值分別為,,總體平均數(shù)為,則稱
為總體方差,為總體標(biāo)準(zhǔn)差.
(4)樣本方差和標(biāo)準(zhǔn)差
如果一個(gè)樣本中個(gè)體的變量值分別為,,,樣本平均數(shù)為,則稱
為樣本方差,為樣本標(biāo)準(zhǔn)差.
(5)加權(quán)方差
如果總體的個(gè)變量值中,不同的值共有()個(gè),記為,,,其中出現(xiàn)的頻數(shù)為(),則總體方差為.
8、相關(guān)關(guān)系的強(qiáng)弱
(1)樣本相關(guān)系數(shù)
現(xiàn)實(shí)生活中的數(shù)據(jù),由于度量對(duì)象和單位的不同等,數(shù)值會(huì)有大有小,為了去除這些因素的影響,統(tǒng)計(jì)學(xué)里一般用來衡量與的線性相關(guān)性強(qiáng)弱,我們稱為變量和變量的樣本相關(guān)系數(shù).
(2)相關(guān)系數(shù)的性質(zhì)
①當(dāng)時(shí),稱成對(duì)樣本數(shù)據(jù)正相關(guān);當(dāng)時(shí),成對(duì)樣本數(shù)據(jù)負(fù)相關(guān);當(dāng)時(shí),成對(duì)樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.
②樣本相關(guān)系數(shù)的取值范圍為
當(dāng)越接近1時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);
當(dāng)越接近0時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越弱.
9、一元線性回歸模型參數(shù)的最小二乘法
回歸直線方程過樣本點(diǎn)的中心,是回歸直線方程最常用的一個(gè)特征;
我們將稱為關(guān)于的線性回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線。這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估計(jì),其中稱為回歸系數(shù),它實(shí)際上也就是經(jīng)驗(yàn)回歸直線的斜率,為截距.
其中
10、殘差
對(duì)于響應(yīng)變量,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.
11、決定系數(shù)
(1)殘差平方和
殘差平方和,殘差平方和越小,模型擬合效果越好,殘差平方和越大,模型擬合效果越差.
(2)決定系數(shù)
決定系數(shù)是度量模型擬合效果的一種指標(biāo),在線性模型中,它代表解釋變量客戶預(yù)報(bào)變量的能力.
,越大,即擬合效果越好,越小,模型擬合效果越差.
12、分類變量與列聯(lián)表
(1)分類變量
為了方便,會(huì)使用一種特殊的隨機(jī)變量,區(qū)別不同的現(xiàn)象或性質(zhì),這隨機(jī)變量稱為分類變量.
(2)列聯(lián)表
①2×2列聯(lián)表給出了兩個(gè)分類變量數(shù)據(jù)的交叉分類頻數(shù).
②定義一對(duì)分類變量和,我們整理數(shù)據(jù)如下表所示:
合計(jì)
合計(jì)
知識(shí)點(diǎn)2:獨(dú)立性檢驗(yàn)
(1)獨(dú)立性檢驗(yàn)定義:
利用的取值推斷分類變量和是否獨(dú)立的方法稱為獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”.簡稱獨(dú)立性檢驗(yàn).
(2)獨(dú)立性檢驗(yàn)公式:
其中(注意使用公式時(shí)分子的平方不要忽略了)
第二部分:重難點(diǎn)題型突破
突破一:隨機(jī)數(shù)表法
1.(2022·廣東·博羅縣榕城中學(xué)高一階段練習(xí))從800件產(chǎn)品中抽取6件進(jìn)行質(zhì)檢,利用隨機(jī)數(shù)表法抽取樣本時(shí),先將800件產(chǎn)品按001,002,…,800進(jìn)行編號(hào).如果從隨機(jī)數(shù)表第8行第8列的數(shù)開始往右讀數(shù)(隨機(jī)數(shù)表第7行至第9行的數(shù)如下),則抽取的6件產(chǎn)品的編號(hào)的75%分位數(shù)是(????)
……
8442175331??5724550688??77047447672176335025??8392120676
6301637859??1695566711??69105671751286735807??4439523879
3321123429??7864560782??52420744381551001342??9966027954
A.105 B.556 C.671 D.169
【答案】C
【詳解】由題設(shè),依次讀取的編號(hào)為,
根據(jù)編號(hào)規(guī)則易知:抽取的6件產(chǎn)品編號(hào)為,
所以將它們從小到大排序?yàn)椋?br />
故,所以75%分位數(shù)為.
故選:C
2.(2022·全國·高一課時(shí)練習(xí))“雙色球”彩票中有33個(gè)紅色球,每個(gè)球的編號(hào)分別為01,02,…,33.一位彩民用隨機(jī)數(shù)表法選取6個(gè)號(hào)碼作為6個(gè)紅色球的編號(hào),選取方法是從下面的隨機(jī)數(shù)表中第1行第5列和第6列的數(shù)字開始,從左向右讀數(shù),則依次選出來的第5個(gè)紅色球的編號(hào)為
7816
6572
0802
6314
0214
4319
9714
0198
3204
9234
4936
8200
3623
4869
6938
7181
A.01 B.02 C.14 D.19
【答案】A
【詳解】分析:根據(jù)隨機(jī)數(shù)表,依次進(jìn)行選擇即可得到結(jié)論.
詳解:從隨機(jī)數(shù)表第1行的第5列和第6列數(shù)字開始由左到右依次選取兩個(gè)數(shù)字中小于33的編號(hào)
去除重復(fù),可知對(duì)應(yīng)的數(shù)值為08,02,14,19,01,04;
則第5個(gè)個(gè)體的編號(hào)為01.
故選A.
3.(2022·江西景德鎮(zhèn)·模擬預(yù)測(理))某公司利用隨機(jī)數(shù)表對(duì)生產(chǎn)的900支新冠疫苗進(jìn)行抽樣測試,先將疫苗按000,001,…,899進(jìn)行編號(hào),從中抽取90個(gè)樣本,若選定從第4行第4列的數(shù)開始向右讀數(shù),(下面摘取了隨機(jī)數(shù)表中的第3行至第5行),根據(jù)下圖,讀出的第6個(gè)數(shù)的編號(hào)是(????)
1676622766??????5650267107??????3290797853????????1355385859????????8897541410
1256859926??????9682731099??????1696729315????????5712101421????????8826498176
5559563564??????3854824622??????3162430990????????0618443253????????2383013030
A.827 B.315 C.696 D.729
【答案】B
【詳解】從685開始向右數(shù),即685,992,696,827,310,991,696,729,315,跳過992,991,696重復(fù),跳過,所以第6個(gè)數(shù)字為315
故選:B
4.(2022·全國·高一課時(shí)練習(xí))福利彩票“雙色球”中紅色球由編號(hào)為01,02,…,33的33個(gè)個(gè)體組成,某彩民利用下面的隨機(jī)數(shù)表(下表是隨機(jī)數(shù)表的第一行和第二行)選取6個(gè)紅色球,選取方法是從隨機(jī)數(shù)表中第1行的第6列和第7列數(shù)字開始,由左到右依次選取兩個(gè)數(shù)字,則選出來的第3個(gè)紅色球的編號(hào)為______.
49??54??43??54??82??17??37??93??23??28??87??35??20??56??43??84??26??34??91??64
57??24??55??06??88??77??04??74??47??67??21??76??33??50??25??83??92??12??06??76
【答案】05
【詳解】根據(jù)隨機(jī)數(shù)表,排除超過33及重復(fù)的編號(hào),第一個(gè)編號(hào)為21,第二個(gè)編號(hào)為32,第三個(gè)編號(hào)05,故選出來的第3個(gè)紅色球的編號(hào)為05.
5.(2022·山西太原·三模(文))設(shè)某總體是由編號(hào)為01,02,…,19,20的20個(gè)個(gè)體組成,利用下面的隨機(jī)數(shù)表選取6個(gè)個(gè)體,選取方法是從隨機(jī)數(shù)表第1行的第3列數(shù)字開始從左到右依次選取兩個(gè)數(shù)字,則選出來的第6個(gè)個(gè)體編號(hào)為___________.
【答案】19
【詳解】解:由隨機(jī)數(shù)的抽樣規(guī)則得:依次選取的樣本編號(hào)為:,
故選出來的第6個(gè)個(gè)體編號(hào)為.
故答案為:
突破二:分層抽樣
1.(2022·河南·開封市東信學(xué)校模擬預(yù)測(文))為了貫徹落實(shí)中央新疆工作座談會(huì)和全國對(duì)口支援新疆工作會(huì)議精神,促進(jìn)邊疆少數(shù)民族地區(qū)教育事業(yè)發(fā)展,從A市20名教師?B市15名教師和C市10名教師中,采取分層抽樣的方法,抽取一個(gè)容量為n的樣本,若A市抽取4人,則(????)
A.9 B.10 C.12 D.15
【答案】A
【詳解】根據(jù)分層抽樣的定義可得,解得.
故選:A.
2.(2022·新疆烏魯木齊·二模(理))從某中學(xué)隨機(jī)抽取100名學(xué)生,將他們的身高數(shù)據(jù)(單位cm)繪制成頻率分布直方圖,若要從身高在,,三組內(nèi)的學(xué)生中,用分層抽樣的方法選取16人參加一次活動(dòng).則從身高在內(nèi)的學(xué)生中選取的人數(shù)應(yīng)為(????)
A.3 B.4 C.5 D.7
【答案】B
【詳解】依題意,解得,
身高在,,三組內(nèi)的學(xué)生比例為,
用分層抽樣的方法選取16人參加一次活動(dòng),
則從身高在內(nèi)的學(xué)生中選取的人數(shù)應(yīng)為人
故選:B
3.(2022·廣西河池·模擬預(yù)測(文))雅言傳承文明,經(jīng)典浸潤人生,南寧市某校每年舉辦“品經(jīng)誦典浴書香,提雅增韻享閱讀”中華經(jīng)典誦讀大賽,比賽內(nèi)容有三類:“誦讀中國”、“詩教中國”、“筆墨中國”.已知高一、高二、高三報(bào)名人數(shù)分別為:100人、150人和250人.現(xiàn)采用分層抽樣的方法,從三個(gè)年級(jí)中抽取25人組成校代表隊(duì)參加市級(jí)比賽,則應(yīng)該從高一年級(jí)學(xué)生中抽取的人數(shù)為______.
【答案】5
【詳解】根據(jù)題意可得:高一、高二、高三報(bào)名人數(shù)之比為,
故從高一年級(jí)學(xué)生中抽取的人數(shù)為.
故答案為:5.
4.(2022·全國·模擬預(yù)測)“中國式過馬路”是網(wǎng)友對(duì)部分中國人集體闖紅燈現(xiàn)象的一種調(diào)侃,即“湊夠一撮人就可以走了,和紅綠燈無關(guān).”出現(xiàn)這種現(xiàn)象是大家受法不責(zé)眾的“從眾”心理影響,從而不顧及交通安全,某校對(duì)全校學(xué)生過馬路方式進(jìn)行調(diào)查,在所有參與調(diào)查的人中,“跟從別人闖紅燈”“從不闖紅燈”“帶頭闖紅燈”人數(shù)如表所示.
跟從別人闖紅燈
從不闖紅燈
帶頭闖紅燈
男生
600
1000
200
女生
400
650
300
用分層抽樣的方法從“帶頭闖紅燈”的人中抽取10人參加“文明交通”宣傳活動(dòng),從這10人中任選取3人,則這三人性別不完全相同的概率為______.
【答案】##0.8
【詳解】由題可知“帶頭闖紅燈”的人中男生與女生的比例為,
所以抽取的10人中,男生有(人),女生有(人),
則這三人中性別不完全相同的概率為.
故答案為:
5.(2022·山東聊城·二模)如圖是調(diào)查某學(xué)校高一年級(jí)男、女學(xué)生是否喜歡徒步運(yùn)動(dòng)而得到的等高條形圖,陰影部分表示喜歡徒步的頻率.已知該年級(jí)男生500人、女生400名(假設(shè)所有學(xué)生都參加了調(diào)查),現(xiàn)從所有喜歡徒步的學(xué)生中按分層抽樣的方法抽取23人,則抽取的男生人數(shù)為______.
【答案】15
【詳解】根據(jù)等高條形圖可知: 喜歡徒步的男生人數(shù)為,喜歡徒步的女生人數(shù)為,
所以喜歡徒步的總?cè)藬?shù)為,
按分層抽樣的方法抽取23人,則抽取的男生人數(shù)為人.
故答案為:15
6.(2022·陜西·交大附中模擬預(yù)測(理))某校為了解學(xué)生學(xué)習(xí)的情況,采用分層抽樣的方法從高一人、高二 人、高三人中,抽取人進(jìn)行問卷調(diào)查.已知高一被抽取的人數(shù)為,那么高三被抽取的人數(shù)為_______.
【答案】
【詳解】由分層抽樣的知識(shí)可得,即,所以高三被抽取的人數(shù)為,應(yīng)填答案.
突破三:頻率分布直方圖
1.(2022·四川省遂寧市第二中學(xué)校模擬預(yù)測(文))在某次高中學(xué)科競賽中,名考生的參賽成績統(tǒng)計(jì)如圖所示,分以下視為不及格,若同一組中數(shù)據(jù)用該組區(qū)間中點(diǎn)作代表,則下列說法中有誤的是(????)
A.成績?cè)诜值目忌藬?shù)最多 B.考生競賽成績的中位數(shù)為分
C.不及格的考生人數(shù)為人 D.考生競賽成績的平均分約分
【答案】B
【詳解】根據(jù)頻率分布直方圖得,成績出現(xiàn)在的頻率最大,所以成績?cè)诜值目忌藬?shù)最多,故A正確;
由于 ,
,
故考生競賽成績的中位數(shù)為 ,故B錯(cuò)誤;
不及格考生數(shù)為 ,故C正確;
根據(jù)頻率分布直方圖估計(jì)考生競賽成績平均分為 ,故D正確。
故選:B.
2.(2022·江蘇·華羅庚中學(xué)三模)光明學(xué)校為了解男生身體發(fā)育情況,從2000名男生中抽查了100名男生的體重情況,根據(jù)數(shù)據(jù)繪制樣本的頻率分布直方圖,如圖所示,下列說法中錯(cuò)誤的是(????)
A.樣本的眾數(shù)約為 B.樣本的中位數(shù)約為
C.樣本的平均值約為66 D.體重超過75kg的學(xué)生頻數(shù)約為200人
【答案】C
【詳解】對(duì)于,樣本的眾數(shù)為,故正確,
對(duì)于,設(shè)樣本的中位數(shù)為,則,
解得,故正確,
對(duì)于,由直方圖估計(jì)樣本平均值可得:
,故錯(cuò)誤,
對(duì)于,2000名男生中體重超過的人數(shù)大約為,故正確.
故選:.
3.(2022·天津·靜海一中模擬預(yù)測)某校隨機(jī)抽取了400名學(xué)生進(jìn)行成績統(tǒng)計(jì),發(fā)現(xiàn)抽取的學(xué)生的成績都在50分至100分之間,進(jìn)行適當(dāng)分組畫出頻率分布直方圖如圖所示,下列說法正確的是(????)
A.直方圖中x的值為0.040
B.在被抽取的學(xué)生中,成績?cè)趨^(qū)間的學(xué)生數(shù)為30人
C.估計(jì)全校學(xué)生的平均成績?yōu)?4分
D.估計(jì)全校學(xué)生成績的樣本數(shù)據(jù)的80%分位數(shù)約為93分
【答案】C
【詳解】定義A:根據(jù)學(xué)生的成績都在50分至100分之間的頻率和為1,可得,解得x=0.03,所以A錯(cuò);
對(duì)于B:在被抽取的學(xué)生中,成績?cè)趨^(qū)間[70,80)的學(xué)生數(shù)為10×0.015×400=60(人),所以B錯(cuò);對(duì)于C:估計(jì)全校學(xué)生的平均成績?yōu)?5×0.05+65×0.1+75×0.15+85×0.3+95×0.4=84(分),所以C對(duì);
對(duì)于D:全校學(xué)生成績的樣本數(shù)據(jù)的80%分位數(shù)約為 (分).
所以D錯(cuò).
故選:C
4.(2022·安徽·模擬預(yù)測(文))某校開展“正心立德,勞動(dòng)樹人”主題教育活動(dòng),對(duì)參賽的100名學(xué)生的勞動(dòng)作品的得分情況進(jìn)行統(tǒng)計(jì),并繪制了如圖所示的頻率分布直方圖,根據(jù)圖中信息,下列說法錯(cuò)誤的是(????)
A.圖中的x值為0.020 B.得分在80分及以上的人數(shù)為40
C.這組數(shù)據(jù)平均數(shù)的估計(jì)值為77 D.這組數(shù)據(jù)中位數(shù)的估計(jì)值為75
【答案】D
【詳解】對(duì)于A選項(xiàng),由頻率分布直方圖可得,,解得,所以A選項(xiàng)正確;
對(duì)于B選項(xiàng),由頻率分布直方圖可知,得分在分以上的人數(shù)為,所以B選項(xiàng)正確;
對(duì)于C選項(xiàng),由頻率分布直方圖可知,這組數(shù)據(jù)平均數(shù)的估計(jì)值為
,所以C選項(xiàng)正確;
對(duì)于D選項(xiàng),由頻率分布直方圖可知,的頻率為,的頻率為,則中位數(shù)在內(nèi),所以這組數(shù)據(jù)中位數(shù)的估計(jì)值為,所以D選項(xiàng)錯(cuò)誤;
故選:D.
5.(2022·云南昆明·一模(文))“雙減”政策實(shí)施后,某初中全面推進(jìn)學(xué)校素質(zhì)教育,推動(dòng)學(xué)校體育運(yùn)動(dòng)發(fā)展,引導(dǎo)學(xué)生積極參與體育鍛煉,為了解該校學(xué)生每周平均體育運(yùn)動(dòng)的時(shí)間,學(xué)校隨機(jī)調(diào)查了500名學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的樣本數(shù)據(jù)(單位:小時(shí)),所得數(shù)據(jù)分成6組:,,,,,據(jù)此得到的頻率分布直方圖如圖所示,則該校學(xué)生每周平均體育運(yùn)動(dòng)的時(shí)間約為______小時(shí)(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值為代表).
【答案】
【詳解】由頻率分布直方圖可知,每周平均體育運(yùn)動(dòng)的時(shí)間約為:
,
故答案為:
6.(2022·廣東汕頭·一模)在黨史學(xué)習(xí)教育動(dòng)員大會(huì)上,習(xí)近平總書記強(qiáng)調(diào)全黨同志要做到學(xué)史明理、學(xué)史增信、學(xué)史崇德,學(xué)史力行.某單位對(duì)200名黨員進(jìn)行黨史知識(shí)測試,將成績分成6組:,,,,,,得到如圖所示的頻率分布直方圖,則______.
【答案】0.050
【詳解】由,
解得,
故答案為:0.050
7.(2022·云南·玉溪市民族中學(xué)模擬預(yù)測(文))全民健身,強(qiáng)國有我,某企業(yè)為增強(qiáng)廣大職工的身體素質(zhì)和健康水平,組織全體職工開啟了“學(xué)習(xí)強(qiáng)國”平臺(tái)的強(qiáng)國運(yùn)動(dòng)項(xiàng)目,為了解他們的具體運(yùn)動(dòng)情況,企業(yè)工會(huì)從該企業(yè)全體職工中隨機(jī)抽取了100名,統(tǒng)計(jì)他們的日均運(yùn)動(dòng)步數(shù),并得到如下頻率分布直方圖:
(1)求直方圖中a的值;
(2)估計(jì)該企業(yè)職工日均運(yùn)動(dòng)步數(shù)的平均數(shù);(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值為代表)
(3)若該企業(yè)恰好有的職工的日均運(yùn)動(dòng)步數(shù)達(dá)到了企業(yè)制定的優(yōu)秀強(qiáng)國運(yùn)動(dòng)者達(dá)標(biāo)線,試估計(jì)該企業(yè)制定的優(yōu)秀強(qiáng)國運(yùn)動(dòng)者達(dá)標(biāo)線是多少?
【答案】(1)
(2)9.08千步
(3)11千步
【詳解】(1)由頻率分布直方圖得,解得.
(2)設(shè)平均數(shù)為,則.
所以該企業(yè)職工日均運(yùn)動(dòng)步數(shù)的平均數(shù)約為9.08千步.
(3)日均運(yùn)動(dòng)步數(shù)在的頻率為,
日均運(yùn)動(dòng)步數(shù)在的頻率為,
則位數(shù)在內(nèi),為,
該企業(yè)制定的優(yōu)秀強(qiáng)國運(yùn)動(dòng)者達(dá)標(biāo)線是11千步
8.(2022·河南省杞縣高中模擬預(yù)測(理))在全民抗擊新冠肺炎疫情期間,某市教育部門開展了“停課不停學(xué)”活動(dòng),為學(xué)生提供了多種網(wǎng)絡(luò)課程資源.活動(dòng)開展一個(gè)月后,某學(xué)校隨機(jī)抽取了高二年級(jí)的學(xué)生若干進(jìn)行網(wǎng)絡(luò)問卷調(diào)查,統(tǒng)計(jì)學(xué)生每天的學(xué)習(xí)時(shí)間(單位:小時(shí)),將樣本數(shù)據(jù)分成,,,,五組(全部數(shù)據(jù)都在內(nèi)),并整理得到如圖所示的頻率分布直方圖.
(1)已知該校高二年級(jí)共有800名學(xué)生,根據(jù)統(tǒng)計(jì)數(shù)據(jù),估計(jì)該校高二年級(jí)每天學(xué)習(xí)時(shí)間不低于5小時(shí)的學(xué)生人數(shù);
(2)利用統(tǒng)計(jì)數(shù)據(jù),估計(jì)該校高二年級(jí)學(xué)生每天平均學(xué)習(xí)時(shí)間;
【答案】(1)640人
(2)5.6小時(shí)
(1)
根據(jù)統(tǒng)計(jì)數(shù)據(jù)估計(jì)該校高二年級(jí)每天學(xué)習(xí)時(shí)間不低于5小時(shí)的學(xué)生人數(shù)為.
所以估計(jì)該校高二年級(jí)每天學(xué)習(xí)不低于5小時(shí)的人數(shù)為640人.
(2)
樣本中學(xué)生每天學(xué)習(xí)時(shí)間的各組頻率分別為0.05,0.15,0.50,0.25,0.05.
樣本中學(xué)生每天平均學(xué)習(xí)時(shí)間為
(小時(shí)).
所以估計(jì)該校高二年級(jí)學(xué)生每天平均學(xué)習(xí)時(shí)間為5.6小時(shí).
9.(2022·新疆克拉瑪依·三模(文))第屆北京冬季奧林匹克運(yùn)動(dòng)會(huì)于年月日至月日在北京和張家口聯(lián)合舉辦.這是中國歷史上第一次舉辦冬季奧運(yùn)會(huì),它掀起了中國人民參與冬季運(yùn)動(dòng)的大熱潮.某市舉辦了中學(xué)生滑雪比賽,從中抽取名學(xué)生的測試分?jǐn)?shù)繪制成莖葉圖和頻率分布直方圖如下,后來莖葉圖受到了污損,可見部分信息如圖.
??????
(1)求頻率分布直方圖中的值,并根據(jù)直方圖估計(jì)該市全體中學(xué)生的測試分?jǐn)?shù)的平均數(shù)(同一組中的數(shù)據(jù)以這組數(shù)據(jù)所在區(qū)間中點(diǎn)的值作代表,結(jié)果保留一位小數(shù));
(2)現(xiàn)要對(duì)測試成績?cè)谇?6%的中學(xué)生頒發(fā)“滑雪達(dá)人”證書,并制定出能夠獲得證書的測試分?jǐn)?shù)線,請(qǐng)你用樣本來估計(jì)總體,給出這個(gè)分?jǐn)?shù)線的估計(jì)值.
【答案】(1),平均數(shù)為
(2)
(1)
解:由頻率分布直方圖可知,測試分?jǐn)?shù)位于的頻率為,
則測試分?jǐn)?shù)位于個(gè)數(shù)為,
所以,測試分?jǐn)?shù)位于的個(gè)數(shù)為,
所以.
估計(jì)平均數(shù)為.
(2)
解:因?yàn)闇y試分?jǐn)?shù)位于的頻率為,測試分?jǐn)?shù)位于的頻率為,
能夠獲得“滑雪達(dá)人”證書的中學(xué)生測試分?jǐn)?shù)要在前,
故設(shè)能夠獲得證書的測試分?jǐn)?shù)線為,則,
由,可得,所以分?jǐn)?shù)線的估計(jì)值為.
10.(2022·廣西·南寧三中一模(文))某種植園在芒果臨近成熟時(shí),隨機(jī)從一些芒果樹上摘下100個(gè)芒果,其質(zhì)量分布在,,,,(單位:克)中,經(jīng)統(tǒng)計(jì)頻率分布直方圖如圖所示.
(1)估計(jì)這組數(shù)據(jù)的平均數(shù);
(2)某經(jīng)銷商來收購芒果,同一組中的數(shù)據(jù)以這組數(shù)據(jù)所在區(qū)間中點(diǎn)的值作代表,用樣本估計(jì)總體,該種植園中共有芒果大約10000個(gè),經(jīng)銷商提出以下兩種收購方案:
方案①:所有芒果以10元/千克收購;
方案②:對(duì)質(zhì)量低于350克的芒果以3元/個(gè)收購,對(duì)質(zhì)量高于或等于350克的芒果以5元/個(gè)收購.
請(qǐng)通過計(jì)算確定種植園選擇哪種方案獲利更多?
【答案】(1)387(克)
(2)方案②獲利更多
【詳解】(1)由頻率分布直方圖可得這組數(shù)據(jù)的平均數(shù)為:
(克);
(2)方案①收入:(元);
方案②收入:由題意得低于350克的收入:(元);
高于或等于350克的收入:(元).
故總計(jì)(元),由于,
故種植園選擇方案②獲利更多.
突破四:平均數(shù),眾數(shù),中位數(shù),方差,標(biāo)準(zhǔn)差
1.(2022·上?!げ軛疃心M預(yù)測)第24屆冬季奧運(yùn)會(huì)于2022年2月4日至20日在北京舉行,中國代表團(tuán)取得了9枚金牌,4枚銀牌,2枚銅牌的歷史最好成績.已知六個(gè)裁判為某一運(yùn)動(dòng)員這一跳的打分分別為95,95,95,93,94,94,評(píng)分規(guī)則為去掉六個(gè)原始分中的一個(gè)最高分和一個(gè)最低分,剩下四個(gè)有效分的平均數(shù)即為該選手的本輪得分.設(shè)這六個(gè)原始分的中位數(shù)為,方差為;四個(gè)有效分的中位數(shù)為,方差為.則下列結(jié)論正確的是(????)
A., B.,
C., D.,
【答案】D
【詳解】將打分95,95,95,93,94,94按照從小到大排列為93,94,94,95,95,95,
無論是否去掉一個(gè)最高分和最低分中位數(shù)都是,故AB錯(cuò)誤;
根據(jù)
;
又
故選:D.
2.(2022·四川·成都市錦江區(qū)嘉祥外國語高級(jí)中學(xué)有限責(zé)任公司模擬預(yù)測(文))冬末春初,乍暖還寒,人們?nèi)菀赘忻鞍l(fā)熱,若發(fā)生群體性發(fā)熱,則會(huì)影響到人們的身體健康,干擾正常工作生產(chǎn),某大型公司規(guī)定:若任意連續(xù)7天,每天不超過5人體溫高于37.3℃,則稱沒有發(fā)生群體性發(fā)熱,下列連續(xù)7天體溫高于37.3℃人數(shù)的統(tǒng)計(jì)特征數(shù)中,能判定該公司沒有發(fā)生群體性發(fā)熱的為(????)
(1)中位數(shù)為3,眾數(shù)為2????(2)均值小于1,中位數(shù)為1
(3)均值為3,眾數(shù)為4????(4)均值為2,標(biāo)準(zhǔn)差為
A.(1)(3) B.(3)(4) C.(2)(3) D.(2)(4)
【答案】D
【詳解】將 7 個(gè)數(shù)由小到大依次記為、、 、、、、.
對(duì)于(1)選項(xiàng),反例:、、、、、、,滿足中位數(shù)為3,眾數(shù)為2,與題意矛盾,(1)選項(xiàng)不合乎要求;
對(duì)于(2)選項(xiàng), 假設(shè),即該公司發(fā)生了群體性發(fā)熱,因中位數(shù)為1,則 ,平均數(shù)為 ,矛盾,故假設(shè)不成立,即該公司沒有發(fā)生群體性發(fā)熱,(2)選項(xiàng)合乎要求;
對(duì)于(3)選項(xiàng),反例:、、 、 、、、,滿足眾數(shù)為4,均值為3,與題意矛盾,(3)選項(xiàng)不合乎要求;
對(duì)于(4)選項(xiàng), 假設(shè),即該公司發(fā)生群體性發(fā)熱,若均值為2 ,則方差為,即,與(4)選項(xiàng)矛盾,故假設(shè)不成立,即該公司沒有發(fā)生群體性發(fā)熱,(4)選項(xiàng)合乎要求.
故選:D
3.(2022·廣西·模擬預(yù)測(文))2022年6月6日是第27個(gè)“全國愛眼日”,為普及科學(xué)用眼知識(shí),提高群眾健康水平,預(yù)防眼疾,某區(qū)殘聯(lián)在殘疾人綜合服務(wù)中心開展“全國愛眼日”有獎(jiǎng)答題競賽活動(dòng).已知5位評(píng)委老師按百分制(只打整數(shù)分)分別給出某參賽小隊(duì)評(píng)分,可以判斷出一定有評(píng)委打滿分的是(????)
A.平均數(shù)為98,中位數(shù)為98 B.中位數(shù)為96,眾數(shù)為99
C.中位數(shù)為97,極差為9 D.平均數(shù)為98,極差為6
【答案】D
【詳解】解:選項(xiàng)A:當(dāng)打分結(jié)果為時(shí),滿足平均數(shù)為98,中位數(shù)為98,所以A錯(cuò)誤;
選項(xiàng)B:當(dāng)打分結(jié)果為時(shí),滿足中位數(shù)為96,眾數(shù)為99,所以B錯(cuò)誤;
選項(xiàng)C:當(dāng)打分結(jié)果為時(shí),滿足中位數(shù)為97,極差為9,所以C錯(cuò)誤;
選項(xiàng)D:假設(shè)沒有評(píng)委打滿分,結(jié)合極差為6可得總成績,
則平均數(shù),與選項(xiàng)不符,故假設(shè)不成立,所以平均數(shù)為98,極差為6時(shí),一定有評(píng)委打滿分,
故選:D.
4.(2022·重慶八中模擬預(yù)測)已知1,這5個(gè)數(shù)的平均數(shù)為3,方差為2,則這4個(gè)數(shù)的方差為(????)
A.1 B. C. D.2
【答案】B
【詳解】∵1,這5個(gè)數(shù)的平均數(shù)為3,方差為2,
∴,即,
∴這4個(gè)數(shù)的平均數(shù)為,
∴,即,
∴這4個(gè)數(shù)的方差為.
故選:B.
5.(2022·河南·南陽中學(xué)三模(文))某區(qū)創(chuàng)建全國文明城市指揮部辦公室對(duì)所轄街道當(dāng)月文明城市創(chuàng)建工作進(jìn)行考評(píng),工作人員在本區(qū)選取了甲,乙兩個(gè)街道,并在這兩個(gè)街道各隨機(jī)抽取10個(gè)實(shí)地點(diǎn)位進(jìn)行現(xiàn)場測評(píng),下面的莖葉圖是兩個(gè)街道的測評(píng)分?jǐn)?shù)(滿分100分),下列說法正確的是(????)
A.甲,乙兩個(gè)街道的測評(píng)分?jǐn)?shù)的極差相等
B.甲,乙兩個(gè)街道的測評(píng)分?jǐn)?shù)的平均數(shù)相等
C.街道乙的測評(píng)分?jǐn)?shù)的眾數(shù)為87
D.甲、乙兩個(gè)街道測評(píng)分?jǐn)?shù)的中位數(shù)中,乙的中位數(shù)比較大
【答案】D
【詳解】街道甲的測評(píng)分?jǐn)?shù)的極差是,街道乙的測評(píng)分?jǐn)?shù)的的極差是,兩者不相等,故A錯(cuò)誤;
街道甲的測評(píng)分?jǐn)?shù)的平均數(shù)為 ,街道乙的測評(píng)分?jǐn)?shù)的平均數(shù)為,故B錯(cuò)誤;
街道乙的測評(píng)分?jǐn)?shù)的眾數(shù)為81,故C錯(cuò)誤;
街道甲的測評(píng)分?jǐn)?shù)的中位數(shù)為,街道乙的測評(píng)分?jǐn)?shù)的中位數(shù)為,故D正確,
故選:D.
6.(2022·安徽六安·一模(文))已知某樣本的容量為100,平均數(shù)為80,方差為95.現(xiàn)發(fā)現(xiàn)在收集這些數(shù)據(jù)時(shí),其中的兩個(gè)數(shù)據(jù)記錄有誤,一個(gè)錯(cuò)將90記錄為70,另一個(gè)錯(cuò)將80記錄為100.在對(duì)錯(cuò)誤的數(shù)據(jù)進(jìn)行更正后,重新求得樣本的平均數(shù)為,方差為,則(????)
A., B., C., D.,
【答案】A
【詳解】由題意,可得,
設(shè)收集的98個(gè)準(zhǔn)確數(shù)據(jù)分別記為,
則
,
,所以.
故選:A
7.(2022·山東·肥城市教學(xué)研究中心模擬預(yù)測)在對(duì)某中學(xué)高一年級(jí)學(xué)生每周體育鍛煉時(shí)間的調(diào)查中,采用隨機(jī)數(shù)法,抽取了男生人,女生人. 已知男同學(xué)每周鍛煉時(shí)間的平均數(shù)為小時(shí),方差為;女同學(xué)每周鍛煉時(shí)間的平均數(shù)為小時(shí),方差為. 依據(jù)樣本數(shù)據(jù),估計(jì)本校高一年級(jí)學(xué)生每周體育鍛煉時(shí)間的方差為___.
【答案】19
【詳解】根據(jù)平均數(shù)的計(jì)算公式,全班的平均數(shù)為,
由,
設(shè)男同學(xué)為,女同學(xué)為,
則男同學(xué)的方差,從而,
則女同學(xué)的方差,從而;
所以全班同學(xué)的方差為.
故答案為:.
8.(2022·四川·石室中學(xué)三模(文))為了考察某校各班參加課外書法小組的人數(shù),在全校隨機(jī)抽取5個(gè)班級(jí),把每個(gè)班級(jí)參加該小組的人數(shù)作為樣本數(shù)據(jù).已知樣本平均數(shù)為10,樣本方差為4,且樣本數(shù)據(jù)互不相同,則樣本數(shù)據(jù)中的最大值為______.
【答案】13
【詳解】設(shè)樣本數(shù)據(jù)由小到大依次為,,,,,
記,
則,.
由于且可知,.
若,則,
得,,,中要么有1個(gè)是4其余3個(gè)是0,要么4個(gè)都是1,
這與樣本數(shù)據(jù)互不相同矛盾;
若,則,取,,,滿足題意;若,則,,,,只有,,,滿足,但此時(shí)不滿足;
若,則,,,,不滿足;綜上可知,,,即樣本數(shù)據(jù)的最大值為13.
故答案為:13
9.(2022·江蘇南京·模擬預(yù)測)已知樣本數(shù)據(jù)的平均數(shù)與方差滿足如下關(guān)系式:,若已知15個(gè)數(shù)的平均數(shù)為6,方差為9;現(xiàn)從原15個(gè)數(shù)中剔除這5個(gè)數(shù),且剔除的這5個(gè)數(shù)的平均數(shù)為8,方差為5,則剩余的10個(gè)數(shù)的方差為___________.
【答案】
【詳解】根據(jù)題目所給的條件,
,
所以,
所以剩余10個(gè)數(shù)的平均數(shù)為5.
,
,
所以,
所以這10個(gè)數(shù)的方差為.
故答案為:
突破五:總體百分位數(shù)
1.(2022·天津河西·三模)學(xué)校組織班級(jí)知識(shí)競賽,某班的12名學(xué)生的成績(單位:分)分別是:58、67、73、74、76、82、82、87、90、92、93、98,則這12名學(xué)生成績的第三四分位數(shù)是(????)
A.88分 B.89分 C.90分 D.91分
【答案】D
【詳解】12名學(xué)生成績由小到大排列為58、67、73、74、76、82、82、87、90、92、93、98,
, 這12名學(xué)生成績的第三四分位數(shù)是,
故選:D
2.(2022·天津市第四十七中學(xué)模擬預(yù)測)為了了解居民用電情況,通過抽樣,獲得了某城市戶居民的月平均用電量(單位:度),以,,,,,,分組的頻率分布直方圖如下圖.該樣本數(shù)據(jù)的55%分位數(shù)大約是(????)
A. B. C. D.
【答案】C
【詳解】由直方圖的性質(zhì)可得:
,
解得,
由已知,設(shè)該樣本數(shù)據(jù)的55%分位數(shù)大約是,由
,
解得.
故選:C.
3.(2022·全國·模擬預(yù)測)據(jù)某地區(qū)氣象局發(fā)布的氣象數(shù)據(jù),未來某十天內(nèi)該地區(qū)每天最高溫度(單位:℃)分別為:31,29,24,27,26,25,24,26,26,23,則這組數(shù)據(jù)的第40百分位數(shù)為(????)
A.27 B.26.5 C.25.5 D.25
【答案】C
【詳解】先將這些數(shù)據(jù)按照從小到大進(jìn)行排序,分別為23,24,24,25,26,26,26,27,29,31,
又,所以該組數(shù)據(jù)的第40百分位數(shù)為排序后的數(shù)列的第4個(gè)數(shù)和第5個(gè)數(shù)的平均數(shù),即,
故選:C.
4.(2022·海南華僑中學(xué)模擬預(yù)測)2022年4月24日是第七個(gè)“中國航天日”,今年的主題是“航天點(diǎn)亮夢想”.某校組織學(xué)生參與航天知識(shí)競答活動(dòng),某班8位同學(xué)成績?nèi)缦拢?,6,8,9,8,7,10,m.若去掉m,該組數(shù)據(jù)的第25百分位數(shù)保持不變,則整數(shù)的值可以是___________(寫出一個(gè)滿足條件的m值即可).
【答案】7或8或9或10(填上述4個(gè)數(shù)中任意一個(gè)均可)
【詳解】7,6,8,9,8,7,10,m,若去掉m,該組數(shù)據(jù)從小到大排列為:6,7,7,8,8,9,10,則,故第25百分位數(shù)為第二個(gè)數(shù)即7,所以7,6,8,9,8,7,10,m,第25百分位數(shù)為7,而,所以7為第二個(gè)數(shù)與第三個(gè)數(shù)的平均數(shù),所以的值可以是7或8或9或10.
故答案為:7或8或9或10.
5.(2022·天津市寧河區(qū)蘆臺(tái)第一中學(xué)模擬預(yù)測)某射擊運(yùn)動(dòng)員次的訓(xùn)練成績分別為:,則這次成績的第百分位數(shù)為__________.
【答案】
【詳解】該射擊運(yùn)動(dòng)員次的訓(xùn)練成績從小到大依次為,因?yàn)椋赃@次成績的第百分位數(shù)為.
故答案為:
突破六:回歸直線方程
1.(2022·陜西·交大附中模擬預(yù)測(文))設(shè)某大學(xué)的女生體重(單位:)與身高(單位:)具有線性相關(guān)關(guān)系,根據(jù)一組樣本數(shù)據(jù),用最小二乘法建立的回歸方程為,則下列結(jié)論中正確結(jié)論的個(gè)數(shù)是(????)
①與具有正的線性相關(guān)關(guān)系;
②回歸直線過樣本點(diǎn)的中心;
③若該大學(xué)某女生身高增加,則其體重約增加;
④若該大學(xué)某女生身高為,則可斷定其體重必為.
A.1 B.2 C.3 D.4
【答案】C
【詳解】由于線性回歸方程中x的系數(shù)為0.85,因此y與x具有正的線性相關(guān)關(guān)系,故①正確;
因?yàn)榛貧w直線必過樣本點(diǎn)的中心,所以②正確;
由線性回歸方程的意義知,某女生的身高增加1cm,其體重約增加0.85kg,故③正確;
當(dāng)某女生的身高為170cm時(shí),其體重估計(jì)值是58.79kg,這不是確定值,因此④不正確.
故選:C.
2.(2022·四川·成都七中模擬預(yù)測(文))根據(jù)一組樣本數(shù)據(jù),,…,,求得經(jīng)驗(yàn)回歸方程為,且.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個(gè)樣本點(diǎn)(1.2,2.2)和(4.8,7.8)誤差較大,去除后重新求得的經(jīng)驗(yàn)回歸直線l的斜率為1.2,則(????)
A.變量x與y具有正相關(guān)關(guān)系
B.去除兩個(gè)誤差較大的樣本點(diǎn)后,重新求得的經(jīng)驗(yàn)回歸方程為
C.去除兩個(gè)誤差較大的樣本點(diǎn)后,y的估計(jì)值增加速度變快
D.去除兩個(gè)誤差較大的樣本點(diǎn)后,相應(yīng)于樣本點(diǎn)(2,3.75)的殘差為0.05
【答案】A
【詳解】解:對(duì)A:經(jīng)驗(yàn)回歸方程為,,
變量與具有正相關(guān)關(guān)系,故選項(xiàng)A正確;
對(duì)B:當(dāng)時(shí),,所以樣本中心為,
去掉兩個(gè)樣本點(diǎn)為和,,,
樣本中心不變,
去除后重新求得的經(jīng)驗(yàn)回歸直線的斜率為1.2,
,解得,
故去除兩個(gè)誤差較大的樣本點(diǎn)后,重新求得的回歸方程為,故選項(xiàng)B錯(cuò)誤;
對(duì)C:,
去除兩個(gè)誤差較大的樣本點(diǎn)后,的估計(jì)值增加速度變慢,故選項(xiàng)C錯(cuò)誤;
對(duì)D:,
,
去除兩個(gè)誤差較大的樣本點(diǎn)后,相應(yīng)于樣本點(diǎn)(2,3.75)的殘差為,故選項(xiàng)D錯(cuò)誤.
故選:A.
3.(2022·重慶八中模擬預(yù)測)某種活性細(xì)胞的存活率()與存放溫度(℃)之間具有線性相關(guān)關(guān)系,樣本數(shù)據(jù)如下表所示:
存放溫度(℃)
10
4
存活率()
20
44
56
80
經(jīng)計(jì)算,回歸直線的斜率為,若這種活性細(xì)胞的存放溫度為℃,則其存活率的預(yù)報(bào)值為(????)A.32% B.33% C.34% D.35%
【答案】C
【詳解】設(shè)回歸直線方程為,由表中數(shù)據(jù)可得,.
因?yàn)榛貧w直線經(jīng)過樣本點(diǎn)中心,則.
所以當(dāng)時(shí),.
故選:C.
4.(2022·江西贛州·一模(理))袁隆平院士是我國的雜交水稻之父,他一生致力于雜交水稻的研究,為解決中國人民的溫飽和保障國家糧食安全做出了重大的貢獻(xiàn).某雜交水稻研究小組先培育出第一代雜交水稻,再由第一代培育出第二代,第二代培育出第三代,以此類推.已知第一代至第四代雜交水稻的每穗總粒數(shù)分別為197粒,193粒,201粒,209粒,且親代與子代的每穗總粒數(shù)成線性相關(guān).根據(jù)以上信息,預(yù)測第五代雜交水稻每穗的總粒數(shù)為(????)
(注:①親代是產(chǎn)生后一代生物的生物,對(duì)后代生物來說是親代,所產(chǎn)生的后一代叫子代:②,)
A.211 B.212 C.213 D.214
【答案】C
【詳解】由題意,設(shè)親代每穗總粒數(shù),子代的每穗總粒數(shù),
則,
,
所以線性回歸方程為
當(dāng)時(shí),
預(yù)測第五代雜交水稻每穗的總粒數(shù)為213
故選:C
5.(2022·全國·模擬預(yù)測)某種新型產(chǎn)品用于推廣營銷的費(fèi)用x(單位:萬元)與該產(chǎn)品的銷售收入y(單位:萬元)在某個(gè)銷售周期內(nèi)的統(tǒng)計(jì)數(shù)據(jù)如下表:
推廣營銷費(fèi)用x
2
3
4
5
6
銷售收入y
14
18
32
37.5
41
根據(jù)上表可得到y(tǒng)關(guān)于x的線性回歸方程,則當(dāng)該產(chǎn)品的銷售收入為80萬元時(shí),用于推廣營銷的費(fèi)用約為______萬元.(結(jié)果精確到0.01)
【答案】11.36
【詳解】由題中統(tǒng)計(jì)數(shù)表可知,,.
因?yàn)榛貧w直線一定過樣本點(diǎn)的中心,代入可得,解得,
于是可得線性回歸方程為,
當(dāng)該產(chǎn)品的銷售收入為80萬元時(shí),,解得.
故答案為:
6.(2022·甘肅武威·模擬預(yù)測(理))已知之間具有線性相關(guān)關(guān)系,若通過10組數(shù)據(jù)得到的回歸方程為,且,則__________.
【答案】8
【詳解】依題意知,,因?yàn)榛貧w方程為,
所以可以計(jì)算出,所以
故答案為:8
7.(2022·廣西廣西·模擬預(yù)測(理))每年的“雙十一”既是旺季來臨的標(biāo)志,也是全年?duì)I銷的大戰(zhàn)役.不管是線上,還是線下都會(huì)有各種宣傳廣告推出各類特價(jià)商品,包括日用百貨、食品、電器、服裝、生鮮等等.據(jù)一商家統(tǒng)計(jì),某商品的廣告支出費(fèi)用x(單位:萬元)與相應(yīng)利潤y(單位:萬元)的關(guān)系如下表格(變量x、y為線性相關(guān)關(guān)系).
x
2
4
6
8
y
20
35
61
80
(1)求y關(guān)于x的線性回歸方程:
(2) 若要使利潤不少于121.1萬元,則廣告支出費(fèi)用至少要多少萬元?
參考公式與數(shù)據(jù):,,.
【答案】(1);
(2)12萬元.
【詳解】(1)解:由題意得:
,
.
.
所以線性回歸方程為.
(2)解:由題可得
解得
所以廣告費(fèi)用支出至少要12萬元.
8.(2022·河南省葉縣高級(jí)中學(xué)模擬預(yù)測(文))生產(chǎn)成本指數(shù)概括反映經(jīng)營生產(chǎn)活動(dòng)中單位成本水平的綜合變動(dòng)程度,它是企業(yè)或部門內(nèi)部進(jìn)行成本管理的一個(gè)有用工具,成本指數(shù)越小,意味著成本控制越好.某企業(yè)從2016年開始連續(xù)6年的生產(chǎn)成本指數(shù)如下表所示:
年份
2016
2017
2018
2019
2020
2021
年數(shù)
1
2
3
4
5
6
生產(chǎn)成本指數(shù)
23
20.5
20.0
16.5
14.0
13.5
(1)由數(shù)據(jù)看出,可用線性回歸模型擬合與的關(guān)系,根據(jù)表中前4年數(shù)據(jù),求關(guān)于的線性回歸方程;
【答案】(1);
(1)
由表中的數(shù)據(jù)可得,,
,,
所以,
,所以所求線性回歸方程為;
9.(2022·寧夏·銀川一中模擬預(yù)測(文))在能源和環(huán)保的壓力下,新能源汽車無疑將成為未來汽車的發(fā)展方向.2016年4月,為促進(jìn)新能源汽車發(fā)展,實(shí)施差異化交通管理政策,公安部啟用新能源汽車專用號(hào)牌.2020年11月,國務(wù)院辦公廳印發(fā)《新能源汽車產(chǎn)業(yè)發(fā)展規(guī)劃(2021—2035年)》,要求深入實(shí)施發(fā)展新能源汽車國家戰(zhàn)略,推動(dòng)中國新能源汽車產(chǎn)業(yè)高質(zhì)量可持續(xù)發(fā)展.下表是2016年至2020年新能源汽車年銷量(單位:十萬輛)情況:
年份
2016
2017
2018
2019
2020
年份編號(hào)
1
2
3
4
5
年銷量
5
7
12
12
14
(1)試建立年銷量關(guān)于年份編號(hào)的線性回歸方程;
(2)根據(jù)(1)中的線性回歸方程預(yù)測2023年新能源汽車的年銷量.
參考公式:,.
【答案】(1)
(2)萬輛
(1),
,
,
所以,
,
所以年銷量關(guān)于年份編號(hào)的線性回歸方程
(2)當(dāng)時(shí),,
所以2023年新能源汽車的年銷量約為萬輛
10.(2022·安徽師范大學(xué)附屬中學(xué)模擬預(yù)測(文))為促進(jìn)新能源汽車的推廣,某市逐漸加大充電基礎(chǔ)設(shè)施的建設(shè),該市統(tǒng)計(jì)了近五年新能源汽車充電站的數(shù)量(單位:個(gè)),得到如下表格:
年份x
2017
2018
2019
2020
2021
新能源汽車充電站數(shù)量y/個(gè)
50
85
105
140
170
(1)若y與x成線性相關(guān)關(guān)系,求y關(guān)于x的線性回歸方程
(2)預(yù)測2025年該市新能源汽車充電站的數(shù)量.
參考公式:
【答案】(1)
(2)
(1)
設(shè)年份代號(hào)為z,2017,2018,2019,2020,2021分別為1,2,3,4,5,
由已知數(shù)據(jù)得,
,
,
,
所以所求線性回歸方程為,
所以;
(2)
將代入線性回歸方程得,
故預(yù)測2025年市新能源汽車充電站的數(shù)量為287個(gè).
突破七:相關(guān)系數(shù)
1.(2022·全國·模擬預(yù)測)住房和城鄉(xiāng)建設(shè)部等六部門發(fā)布通知提出,到2025年,農(nóng)村生活垃圾無害化處理水平明顯提升.我國生活垃圾主要有填埋、焚燒與堆肥三種處理方式,隨著我國垃圾處理結(jié)構(gòu)的不斷優(yōu)化調(diào)整,焚燒處理逐漸成為市場主流.根據(jù)國家統(tǒng)計(jì)局公布的數(shù)據(jù),對(duì)2013—2020年全國生活垃圾焚燒無害化處理廠的個(gè)數(shù)y(單位:座)進(jìn)行統(tǒng)計(jì),得到如下表格:
年份
2013
2014
2015
2016
2017
2018
2019
2020
年份代碼x
1
2
3
4
5
6
7
8
生活垃圾焚燒無害化處理廠的個(gè)數(shù)y
166
188
220
249
286
331
389
463
(1)由表中數(shù)據(jù)可知,可用線性回歸模型擬合y與x之間的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說明;(精確到0.01)
(2)求出y關(guān)于x的線性回歸方程,并預(yù)測2022年全國生活垃圾焚燒無害化處理廠的個(gè)數(shù);
(3)對(duì)于2035年全國生活垃圾焚燒無害化處理廠的個(gè)數(shù),還能用所求的線性回歸方程預(yù)測嗎?請(qǐng)簡要說明理由.
參考公式:相關(guān)系數(shù),回歸方程中斜率和截距的最小二乘估計(jì)公式分別為,.
參考數(shù)據(jù):,,,,,,.
【答案】(1)0.98,可用線性回歸模型擬合y與x之間的關(guān)系;
(2),2022年處理廠個(gè)數(shù)為513;
(3)不能用所求線性回歸方程預(yù)測,理由見解析.
【詳解】(1)由題意,,,
相關(guān)系數(shù)
,因?yàn)閥與x的相關(guān)系數(shù),接近于1,
所以y與x的線性相關(guān)程度相當(dāng)高,可用線性回歸模型擬合y與x之間的關(guān)系;
(2)由題意,
,
,
所以y關(guān)于x的線性回歸方程為,
易知2022年對(duì)應(yīng)的年份代碼,
當(dāng)時(shí),,所以預(yù)測2022年全國生活垃圾焚燒無害化處理廠的個(gè)數(shù)為513;
(3)對(duì)于2035年全國生活垃圾焚燒無害化處理廠的個(gè)數(shù),不能用所求線性回歸方程預(yù)測,
理由如下(說出一點(diǎn)即可):
①線性回歸方程具有時(shí)效性,不能預(yù)測較遠(yuǎn)情況;
②全國生活垃圾焚燒無害化處理廠的個(gè)數(shù)有可能達(dá)到上限,一段時(shí)間內(nèi)不再新建;
③受國家政策的影響,可能產(chǎn)生新的生活垃圾無害化處理方式.
2.(2022·全國·模擬預(yù)測)教育部印發(fā)的《義務(wù)教育課程方案和課程標(biāo)準(zhǔn)(2022年版)》指出,自2022年秋季開始,勞動(dòng)課將成為中小學(xué)一門獨(dú)立課程.消息一出,“中小學(xué)生學(xué)做飯”等相關(guān)話題引發(fā)大量網(wǎng)友關(guān)注,兒童廚具也迅速走俏.這類兒童廚具并不是指傳統(tǒng)意義上的“過家家”,而是真鍋真鏟真爐灶,能讓孩子煎炒烹炸,把飯菜做熟了吃下肚的“真煮”兒童廚具.一家廚具批發(fā)商從2022年5月22日起,每10天就對(duì)“真煮”兒童廚具的銷量統(tǒng)計(jì)一次,得到相關(guān)數(shù)據(jù)如下表所示.
時(shí)間
5月22~5月31日
6月1~6月10日
6月11~6月20日
6月21~6月30日
7月1~7月10日
7月11~7月20日
7月21~7月30日
時(shí)間代碼x
1
2
3
4
5
6
7
銷量y/千件
9.4
9.6
9.9
10.1
10.6
11.1
11.4
(1)從這7次統(tǒng)計(jì)數(shù)據(jù)中隨機(jī)抽取2次,求這2次的銷量之和超過21千件的概率.
(2)根據(jù)表中數(shù)據(jù),判斷y與x是否具有線性相關(guān)關(guān)系?若具有,試求出y關(guān)于x的線性回歸方程;若不具有,請(qǐng)說明理由.(結(jié)果保留兩位小數(shù))
附:線性回歸方程中斜率和截距的最小二乘估計(jì)公式分別為,,相關(guān)系數(shù),.
【答案】(1)
(2)有,
【詳解】(1)從7次統(tǒng)計(jì)數(shù)據(jù)中任意選取2次有種選法,
其中滿足條件的有,,,,,,共6種,
所以所求概率.
(2)由表格數(shù)據(jù),得,
,
所以
,
,
,
所以相關(guān)系數(shù).
因?yàn)橄嚓P(guān)系數(shù),接近1,所以y與x具有線性相關(guān)關(guān)系,且正相關(guān)性很強(qiáng).
因?yàn)椋?br />
所以,
所以y關(guān)于x的線性回歸方程為.
3.(2022·吉林·東北師大附中模擬預(yù)測(文))2015年7月31日,在吉隆坡舉行的國際奧委會(huì)第128次全會(huì)上,北京獲得2022年冬奧會(huì)舉辦權(quán).在申冬奧過程中,中國正式向國際社會(huì)作出“帶動(dòng)三億人參與冰雪運(yùn)動(dòng)”的莊嚴(yán)承諾.這一承諾,既是我國為國際奧林匹克運(yùn)動(dòng)做出重大貢獻(xiàn)的大國擔(dān)當(dāng)展現(xiàn),也是根據(jù)我國經(jīng)濟(jì)水平和全民健身需求做出的群眾性運(yùn)動(dòng)的戰(zhàn)略部署.從北京冬奧會(huì)申辦成功到2021年10月,全國參與冰雪運(yùn)動(dòng)人數(shù)累計(jì)達(dá)到3.46億,實(shí)現(xiàn)了“帶動(dòng)三億人參與冰雪運(yùn)動(dòng)”的目標(biāo),這是北京冬奧會(huì)給予全球冬季體育運(yùn)動(dòng)和奧林匹克運(yùn)動(dòng)的最為重要的遺產(chǎn),可以說是2022年北京冬奧會(huì)的第一塊金牌.“冬奧熱”帶動(dòng)“冰雪熱”,也帶動(dòng)了冰雪經(jīng)濟(jì),以冰雪運(yùn)動(dòng)為主要內(nèi)容的冰雪旅游近年來發(fā)展迅速,2016至2022六個(gè)冰雪季的旅游人次y(單位億)的數(shù)據(jù)如下表:
年度
2016—2017
2017—2018
2018—2019
2019—2020
2020—2021
2021—2022
年度代號(hào)t
1
2
3
4
5
6
旅游人次y
1.7
1.97
2.24
0.94
2.54
3.15
(1)求y與t的相關(guān)系數(shù)(精確到0.01),并回答y與t的線性相關(guān)關(guān)系的強(qiáng)弱;
(2)因受疫情影響,現(xiàn)將2019—2020年度的異常數(shù)據(jù)剔除,用剩下的5個(gè)年度數(shù)據(jù)(年度代號(hào)不變),求y關(guān)于t的線性回歸方程(系數(shù)精確到0.01),并推測沒有疫情情況下,2019—2020年度冰雪旅游人次的估計(jì)值.
附注:參考數(shù)據(jù):,,,,.參考公式:相關(guān)系數(shù),回歸直線的斜率和截距的最小二乘估計(jì)公式分別為:,
【答案】(1),線性相關(guān)性不強(qiáng)
(2),億
【詳解】(1)由參考數(shù)據(jù)計(jì)算得
所以,
因?yàn)?,所以線性相關(guān)性不強(qiáng).
(2)五組數(shù)據(jù)的均值分別為,
,
關(guān)于的線性回歸方程為
令,則,
因此,在沒有疫情情況下,2019-2020年度冰雪旅游人次的估計(jì)值為億.
4.(2022·甘肅·高臺(tái)縣第一中學(xué)模擬預(yù)測(文))應(yīng)對(duì)嚴(yán)重威脅人類生存與發(fā)展的氣候變化,其關(guān)鍵在于“控碳”,其必由之路是先實(shí)現(xiàn)“碳達(dá)峰”,而后實(shí)現(xiàn)“碳中和”,2020年第七十五屆聯(lián)合國大會(huì)上,我國向世界鄭重承諾:爭在2030年前實(shí)現(xiàn)“碳達(dá)峰”,努力爭取在2060年前實(shí)現(xiàn)“碳中和”,近年來,國家積極發(fā)展新能源汽車,某品牌的新能源汽車某區(qū)域銷售在2021年11月至2022年3月這5個(gè)月的銷售量(單位:百輛)的數(shù)據(jù)如下表:
月份
2021年11月
2021年12月
2022年1月
2022年2月
2022年3月
月份代碼:
1
2
3
4
5
銷售量(單位:百輛)
45
56
64
68
72
(1)依據(jù)表中的統(tǒng)計(jì)數(shù)據(jù),請(qǐng)判斷月份代碼與該品牌的新能源汽車區(qū)域銷售量(單位;百輛)是否具有較高的線性相關(guān)程度?(參考:若,則線性相關(guān)程度一般,若,則線性相關(guān)程度較高,計(jì)算時(shí)精確度為0.01.
(2)求銷售量與月份代碼之間的線性回歸方程,并預(yù)測2022年4月份該區(qū)域的銷售量(單位:百輛)
參考數(shù)據(jù):,,,參考公式:相關(guān)系數(shù),
線性回歸方程中,,,其中,為樣本平均值.
【答案】(1)月份代碼與銷售量(單位:百輛)具有較高的線性相關(guān)程度,可用線性回歸模型擬合銷售量與月份代碼之間的關(guān)系.
(2),預(yù)測2022年4月該品牌的新能源汽車該區(qū)域的銷售量為 百輛
(1)
由表中數(shù)據(jù)可得 ,
所以 ,又, ,
所以.
所以月份代碼與銷售量(單位: 百輛)具有較高的線性相關(guān)程度,可用線性回歸模型擬合銷售量與月份代碼之間的關(guān)系.
(2)
由表中數(shù)據(jù)可得 ,
則,所以 ,
令,可得 (百輛),
故可預(yù)測2022年4月該品牌的新能源汽車該區(qū)域的銷售量為百輛.
5.(2022·全國·模擬預(yù)測)數(shù)字經(jīng)濟(jì)的發(fā)展需要、云計(jì)算、大數(shù)據(jù)及物聯(lián)網(wǎng)等新型基礎(chǔ)設(shè)施的支撐,作為新基建之首,對(duì)我國數(shù)字經(jīng)濟(jì)的發(fā)展有著重要的意義.技術(shù)在我國已經(jīng)進(jìn)入高速發(fā)展階段,寬帶業(yè)務(wù)辦理量也逐漸上升.某營業(yè)廳統(tǒng)計(jì)了2021年7月至2022年1月寬帶業(yè)務(wù)辦理量(單位:單),如表所示:
時(shí)間
2021年7月
2021年8月
2021年9月
2021年10月
2021年11月
2021年12月
2022年1月
月份編號(hào)
1
2
3
4
5
6
7
寬帶業(yè)務(wù)辦理量/單
290
330
360
440
480
520
590
(1)由表中數(shù)據(jù)可知,可用線性回歸模型擬合與之間的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說明(結(jié)果精確到0.01);
(2)求出關(guān)于的線性回歸方程,并估計(jì)該營業(yè)廳2022年4月的寬帶業(yè)務(wù)辦理量.
參考數(shù)據(jù):,,.
參考公式:相關(guān)系數(shù),回歸方程中斜率和截距的最小二乘估計(jì)公式分別為,.
【答案】(1)答案見解析;
(2),730單.
(1)
解:由題意知,
,
∴相關(guān)系數(shù).
∵與的相關(guān)系數(shù)近似為0.99,∴與之間的線性相關(guān)程度相當(dāng)高,
從而可以用線性回歸模型擬合與之間的關(guān)系.
(2)
解:,∴,
∴關(guān)于的線性回歸方程為,
2022年4月對(duì)應(yīng)的編號(hào)為10,將代入線性回歸方程,得,
∴估計(jì)該營業(yè)廳在2022年4月的寬帶業(yè)務(wù)辦理量為730單.
突破八:殘差(相關(guān)指數(shù))
1.(2022·重慶八中模擬預(yù)測)身高體重指數(shù)(BMI)的大小直接關(guān)系到人的健康狀況,某高中高三(1)班班主任為了解該班學(xué)生的身體健康狀況,從該班學(xué)生中隨機(jī)選取5名學(xué)生,測量其身高、體重的數(shù)據(jù)如下表.
學(xué)生編號(hào)
1
2
3
4
5
身高x/cm
l65
170
175
170
170
體重y/kg
58
67
67
65
63
(1)求體重關(guān)于身高的線性回歸方程,并預(yù)測身高為180cm的同學(xué)的體重;
(2)試分析學(xué)生的體重差異約有多少是由身高引起的?(注:結(jié)果保留兩位小數(shù))參考公式:線性回歸方程中,,,其中,為樣本平均值,.
【答案】(1),身高為180cm的同學(xué)的體重大約為;
(2)
(1)
解:依題意可,,
,
所以,
所以回歸直線方程為,
當(dāng)時(shí),所以身高為180cm的同學(xué)的體重大約為;
(2)
由(1)回歸方程可得,各組數(shù)據(jù)的殘差,如表所示:
學(xué)生編號(hào)
1
2
3
4
5
身高
165
170
175
170
170
體重
58
67
67
65
63
殘差
所以,
,
則,
故學(xué)生的體重差異約有是由身高引起的.
2.(2022·山東師范大學(xué)附中模擬預(yù)測)某研究所為了研究某種昆蟲的產(chǎn)卵數(shù)與溫度之間的關(guān)系,現(xiàn)將收集到的溫度和一組昆蟲的產(chǎn)卵數(shù)的6組觀測數(shù)據(jù)作了初步處理,得到如圖的散點(diǎn)圖及一些統(tǒng)計(jì)數(shù)據(jù).
經(jīng)計(jì)算得到以下數(shù)據(jù):,.
(1)若用線性回歸模型來擬合數(shù)據(jù)的變化關(guān)系,求y關(guān)于x的回歸方程(結(jié)果精確到0.1);
(2)若用非線性回歸模型來擬合數(shù)據(jù)的變化關(guān)系,求得關(guān)于的回歸方程,且相關(guān)指數(shù)為.
①試與(1)中的回歸模型相比,用R2說明哪種模型的擬合效果更好;
②用擬合效果好的模型預(yù)測溫度為35℃時(shí)該組昆蟲的產(chǎn)卵數(shù)(結(jié)果四舍五入取整數(shù)).
附參考公式:對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù),其回歸直線截距和斜率的最小二乘法估計(jì)公式分別為:,相關(guān)系數(shù):.參考數(shù)據(jù):.
【答案】(1);
(2)①用比擬合效果更好;②190個(gè).
(1)
由題意可知,
;
∴y關(guān)于x的線性回歸方程是;
(2)
①用指數(shù)回歸模型擬合y與x的關(guān)系,相關(guān)指數(shù),
線性回歸模型擬合y與x的關(guān)系,相關(guān)指數(shù),
且,
∴用比擬合效果更好.
②中,令,
則,
故預(yù)測溫度為時(shí)該昆蟲產(chǎn)卵數(shù)約為190個(gè).
3.(2022·重慶市涪陵高級(jí)中學(xué)校模擬預(yù)測)為響應(yīng)黨中央“扶貧攻堅(jiān)”的號(hào)召,某單位指導(dǎo)一貧困村通過種植紫甘薯來提高經(jīng)濟(jì)收入.紫甘薯對(duì)環(huán)境溫度要求較高,根據(jù)以往的經(jīng)驗(yàn),隨著溫度的升高,其死亡株數(shù)成增長的趨勢.下表給出了2021年種植的一批試驗(yàn)紫甘薯在溫度升高時(shí)6組死亡的株數(shù).
溫度/℃
21
23
24
27
29
30
死亡數(shù)/株
6
11
20
27
57
77
經(jīng)計(jì)算,,,,,
,,,其中,分別為試驗(yàn)數(shù)據(jù)中的溫度和死亡株數(shù),.
(1)若用一元線性回歸模型,求關(guān)于的經(jīng)驗(yàn)回歸方程;
(2)若用非線性回歸模型求得關(guān)于的非線性經(jīng)驗(yàn)回歸方程,且相關(guān)指數(shù)為.
(?。┰嚺c(1)中的回歸模型相比,用說明哪種模型的擬合效果更好;
(ii)用擬合效果好的模型預(yù)測溫度為35℃時(shí)該批紫甘薯的死亡株數(shù)(結(jié)果取整數(shù)).
附:對(duì)于一組數(shù)據(jù)其回歸直線的斜率和截距的最小二乘估計(jì)分別為:,;相關(guān)指數(shù)為:.
【答案】(1);
(2)①;②192.
(1)
由題意可知,
,
∴關(guān)于的線性回歸方程是;
(2)
①用指數(shù)回歸模型擬合與的關(guān)系,相關(guān)指數(shù),
線性回歸模型擬合與的關(guān)系,相關(guān)指數(shù),
則,
∴用比擬合效果更好;
②中,令,
則,
故預(yù)測溫度為時(shí)該紫甘薯死亡株數(shù)約為192株.
4.(2022·內(nèi)蒙古·滿洲里市教育研修中心三模(文))碳中和,是指企業(yè)、團(tuán)體或個(gè)人測算在一定時(shí)間內(nèi),直接或間接產(chǎn)生的溫室氣體排放總量,通過植樹造林、節(jié)能減排等形式,抵消自身產(chǎn)生的二氧化碳排放,實(shí)現(xiàn)二氧化碳的“零排放”.碳達(dá)峰,是指碳排放進(jìn)入平臺(tái)期后,進(jìn)入平穩(wěn)下降階段.簡單地說就是讓二氧化碳排放量“收支相抵”.中國政府在第七十五屆聯(lián)合國大會(huì)上提出:“中國將提高國家自主貢獻(xiàn)力度,采取更加有力的政策和措施,二氧化碳排放力爭于2030年前達(dá)到峰值,努力爭取2060年前實(shí)現(xiàn)碳中和.”減少碳排放,實(shí)現(xiàn)碳中和,人人都可出一份力.某中學(xué)數(shù)學(xué)教師組織開展了題為“家庭燃?xì)庠钚o的最佳角度”的數(shù)學(xué)建模活動(dòng).實(shí)驗(yàn)假設(shè):
①燒開一壺水有諸多因素,本建模的變量設(shè)定為燃?xì)庥昧颗c旋鈕的旋轉(zhuǎn)角度,其他因素假設(shè)一樣;
②由生活常識(shí)知,旋轉(zhuǎn)角度很小或很大,一壺水甚至不能燒開或造成燃?xì)饫速M(fèi),因此旋轉(zhuǎn)角度設(shè)定在10°到90°間,建模實(shí)驗(yàn)中選取5個(gè)代表性數(shù)據(jù):18°,36°,54°,72°,90°.
某支數(shù)學(xué)建模隊(duì)收集了“燒開一壺水”的實(shí)驗(yàn)數(shù)據(jù),如下表:
項(xiàng)目
旋轉(zhuǎn)角度
開始燒水時(shí)燃?xì)獗碛?jì)數(shù)/dm3
水燒開時(shí)燃?xì)獗碛?jì)數(shù)/dm3
18°
9080
9210
36°
8958
9080
54°
8819
8958
72°
8670
8819
90°
8498
8670
以x表示旋轉(zhuǎn)角度,y表示燃?xì)庥昧?
(1)用列表法整理數(shù)據(jù)(x,y);
x(旋轉(zhuǎn)角度:度)
18
36
54
72
90
y(燃?xì)庥昧浚篸m3)
(2)假定x,y線性相關(guān),試求回歸直線方程(注:計(jì)算結(jié)果精確到小數(shù)點(diǎn)后三位)
(3)有隊(duì)員用二次函數(shù)進(jìn)行模擬,得到的函數(shù)關(guān)系為.求在該模型中,燒開一壺水燃?xì)庥昧孔钌贂r(shí)的旋轉(zhuǎn)角度.請(qǐng)用相關(guān)指數(shù)R2分析二次函數(shù)模型與線性回歸模型哪種擬合效果更好?(注:計(jì)算結(jié)果精確到小數(shù)點(diǎn)后一位)
參考數(shù)據(jù):,,,,
線性回歸模型,二次函數(shù)模型.
參考公式:,,.
【答案】(1)列表見解析;
(2);
(3)38.7°,二次函數(shù)擬合效果更好.
(1)
整理數(shù)據(jù)如圖:
x(旋轉(zhuǎn)角度:度)
18
36
54
72
90
y(燃?xì)庥昧浚篸m3)
130
122
139
149
172
(2),,,
,
故回歸直線方程為;
(3),即旋轉(zhuǎn)角約為38.7°時(shí),燒開一壺水燃?xì)庥昧孔钌?
回歸直線與二次函數(shù)擬合兩者關(guān)系時(shí),相關(guān)指數(shù)分別為,,
則,.
因?yàn)椋远魏瘮?shù)擬合效果更好.
突破九:非線性回歸
1.(2022·山東臨沂·三模)在疫情防控常態(tài)化的背景下,山東省政府各部門在保安全,保穩(wěn)定的前提下有序恢復(fù)生產(chǎn),生活和工作秩序,五一期間,文旅部門在落實(shí)防控舉措的同時(shí),推出了多款套票文旅產(chǎn)品,得到消費(fèi)者的積極回應(yīng).下面是文旅部門在某地區(qū)推出六款不同價(jià)位的旅游套票,每款的套票價(jià)格x(單位:元)與購買人數(shù)y(單位:萬人)的數(shù)據(jù)如下表:
旅游類別
城市展館科技游
鄉(xiāng)村特色游
齊魯紅色游
登山套票
游園套票
觀海套票
套票價(jià)格x(元)
39
49
58
67
77
86
購買數(shù)量y(萬人)
16.7
18.7
20.6
22.5
24.1
25.6
在分析數(shù)據(jù)、描點(diǎn)繪圖中,發(fā)現(xiàn)散點(diǎn)集中在一條直線附近,其中
(1)根據(jù)所給數(shù)據(jù),求y關(guān)于x的回歸方程;
附:①可能用到的數(shù)據(jù);.
②對(duì)于一組數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計(jì)值分別為
【答案】(1)
(1)散點(diǎn)集中在一條直線附近,設(shè)回歸直線方程為
由,則
變量關(guān)于的回歸方程為
綜上,y關(guān)于x的回歸方程為
2.(2022·吉林長春·模擬預(yù)測(理))今年全國兩會(huì)期間,習(xí)近平總書記在看望參加全國政協(xié)十三屆五次會(huì)議的農(nóng)業(yè)界?社會(huì)福利和社會(huì)保障界委員時(shí)指出“糧食安全是‘國之大者’.悠悠萬事,吃飯為大.”某校課題小組針對(duì)糧食產(chǎn)量與化肥施用量以及與化肥有效利用率間關(guān)系進(jìn)行研究,收集了10組化肥施用量和糧食畝產(chǎn)量的數(shù)據(jù),并對(duì)這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.每畝化肥施用量為x(單位:公斤),糧食畝產(chǎn)量為y(單位:百公斤).
參考數(shù)據(jù):
650
91.5
52.5
1478.6
30.5
15
15
46.5
表中,
(1)根據(jù)散點(diǎn)圖判斷,與,哪一個(gè)適宜作為糧食畝產(chǎn)量y關(guān)于每畝化肥施用量x的回歸方程(給出判斷即可,不必說明理由);
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;并預(yù)測每畝化肥施用量為27公斤時(shí),糧食畝產(chǎn)量y的值;()
附:①對(duì)于一組數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計(jì)分別為,;②若隨機(jī)變量,則有,.
【答案】(1);
(2);8.1百公斤;
【詳解】(1)根據(jù)散點(diǎn)圖可知y與x的關(guān)系不是線性的關(guān)系,則更適宜.
(2)∵,∴,令,,
則,,,
∴,,,
∴,當(dāng)時(shí),(百公斤).
3.(2022·山東日照·二模)2018年9月10日,全國教育大會(huì)在北京召開,習(xí)近平總書記在會(huì)上提出“培養(yǎng)德智體美勞全面發(fā)展的社會(huì)主義建設(shè)者和接班人”.某學(xué)校貫徹大會(huì)精神,為學(xué)生開設(shè)了一門模具加工課,經(jīng)過一段時(shí)間的學(xué)習(xí),擬舉行一次模具加工大賽,學(xué)生小明?小紅打算報(bào)名參加大賽.
(1)賽前,小明進(jìn)行了一段時(shí)間的強(qiáng)化訓(xùn)練,加工完成一個(gè)模具的平均速度y(秒)與訓(xùn)練天數(shù)x(天)有關(guān),經(jīng)統(tǒng)計(jì)得到如下表數(shù)據(jù):
x(天)
1
2
3
4
5
6
7
y(秒)
990
990
450
320
300
240
210
經(jīng)研究發(fā)現(xiàn),可用作為回歸方程模型,請(qǐng)利用表中數(shù)據(jù),求出該回歸方程,并預(yù)測小明經(jīng)過50天訓(xùn)練后,加工完成一個(gè)模具的平均速度y約為多少秒?
參考數(shù)據(jù):(其中)
1845
0.37
0.55
參考公式:對(duì)于一組數(shù)據(jù),,…,,其回歸直線的斜率和截距的最小二乘估計(jì)公式分別為,.
【答案】(1);150;
【詳解】(1)由題意,,
令,設(shè)y關(guān)于t的線性回歸方程為,
則,
則,
∴,
∴y關(guān)于x的回歸方程為,
當(dāng)時(shí),,
∴預(yù)測小明經(jīng)過50天訓(xùn)練后,加工完成一個(gè)模具的平均速度y約為150秒;
4.(2022·江西贛州·二模(理))某公交公司分別推出支付寶和微信掃碼支付乘車活動(dòng),活動(dòng)設(shè)置了一段時(shí)間的推廣期,由于推廣期內(nèi)優(yōu)惠力度較大,吸引越來越多的人開始使用掃碼支付.某線路公交車隊(duì)統(tǒng)計(jì)了活動(dòng)剛推出一周內(nèi)每一天使用掃碼支付的人次,用x表示活動(dòng)推出的天數(shù),y表示每天使用掃碼支付的人次,統(tǒng)計(jì)數(shù)據(jù)如下表所示:
x
1
2
3
4
5
6
7
y
6
11
21
34
66
101
196
根據(jù)以上數(shù)據(jù),繪制了如圖所示的散點(diǎn)圖.
(1)根據(jù)散點(diǎn)圖,判斷在推廣期內(nèi),與(c,d均為大于零的常數(shù))哪一個(gè)適宜作為掃碼支付的人次y關(guān)于活動(dòng)推出天數(shù)x的回歸方程類型?(給出判斷即可,不必說明理由);
(2)根據(jù)(1)的判斷結(jié)果及題干中表格內(nèi)的數(shù)據(jù),建立y關(guān)于x的回歸方程,并預(yù)測活動(dòng)推出第8天使用掃碼支付的人次.
參考數(shù)據(jù):
62.14
1.54
2535
50.12
3.47
其中,.
參考公式:對(duì)于一組數(shù)據(jù),,…,,其回歸直線的斜率和截距的最小二乘估計(jì)公式分別為,.
【答案】(1)適宜
(2),活動(dòng)推出第8天使用掃碼支付的人次為347
(1)解:根據(jù)散點(diǎn)圖判斷,適宜作為掃碼支付的人次y關(guān)于活動(dòng)推出天數(shù)x的回歸方程類型
(2)解:因?yàn)?,所以兩邊同時(shí)取常用對(duì)數(shù),得.
設(shè),,則
因?yàn)椋?br />
所以.
所以
所以
故
把代入上式,得
所以y關(guān)于x的回歸方程為,
活動(dòng)推出第8天使用掃碼支付的人次為347.
5.(2022·湖南·雅禮中學(xué)二模)“不關(guān)注分?jǐn)?shù),就是對(duì)學(xué)生的今天不負(fù)責(zé):只關(guān)注分?jǐn)?shù),就是對(duì)學(xué)生的未來不負(fù)責(zé).”為鍛煉學(xué)生的綜合實(shí)踐能力,長沙市某中學(xué)組織學(xué)生對(duì)雨花區(qū)一家奶茶店的營業(yè)情況進(jìn)行調(diào)查統(tǒng)計(jì),得到的數(shù)據(jù)如下:
月份x
2
4
6
8
10
12
凈利潤(萬元〕y
0.9
2.0
4.2
3.9
5.2
5.1
(1)設(shè).試建立y關(guān)于x的非線性回歸方程和(保留2位有效數(shù)字);
(2)從相關(guān)系數(shù)的角度確定哪一個(gè)模型的擬合效果更好,并據(jù)此預(yù)測次年2月()的凈利潤(保留1位小數(shù)).
附:①相關(guān)系數(shù),回歸直線中斜率和截距的最小二乘估計(jì)公式分別為;②參考數(shù)據(jù):,
【答案】(1)和;
(2)模型的擬合效果更好,次年2月凈利潤為萬元
(1)
,
,
,
,
所以,,
所以模型的方程為,
,
,
,
所以,,
所以模型的方程為;
(2)
,
所以,
,
因?yàn)楦咏?,所以模型的擬合效果更好,
則次年2月凈利潤為萬元.
突破十:獨(dú)立性檢驗(yàn)
1.(2022·四川·雙流中學(xué)模擬預(yù)測(文))自《“健康中國2030”規(guī)劃綱要》頒布實(shí)施以來,越來越多的市民加入到綠色運(yùn)動(dòng)“健步走”行列以提高自身的健康水平與身體素質(zhì). 某調(diào)查小組為了解本市不同年齡段的 市民在一周內(nèi)健步走的情況,在市民中隨機(jī)抽取了200人進(jìn)行調(diào)查,部分結(jié)果如下表所示,其中一周內(nèi)健步走少于5萬步的人數(shù)占樣本總數(shù)的 歲以上(含45歲)的人數(shù)占樣本總數(shù)的.
一周內(nèi)健步走萬步
一周內(nèi)健步走萬
總計(jì)
45歲以上(含45歲)
90
45歲以下
總計(jì)
200
(1)請(qǐng)將題中表格補(bǔ)充完整,并判斷是否有的把握認(rèn)為該市市民一周內(nèi)健步走的步數(shù)與年齡有關(guān);
附:
0.150
0.100
0.050
0.025
2.072
2.706
3.841
5.024
,其中.
【答案】(1)表格見解析,有的把握認(rèn)為該市市民一周內(nèi)健步走的步數(shù)與年軨有關(guān)
【詳解】(1)解:由題意得,總?cè)藬?shù)為200,
45歲以上(含45歲)的人數(shù)為,
45歲以下的人數(shù)為 80.
一周內(nèi)健步走少于5萬步的人數(shù)為 ,
由此得如下列聯(lián)表:
一周內(nèi)健步走5 萬步
一周內(nèi)健步走
這是一份統(tǒng)考版2024高考數(shù)學(xué)二輪專題復(fù)習(xí)專題四統(tǒng)計(jì)與概率第1講統(tǒng)計(jì)統(tǒng)計(jì)案例理,共11頁。
這是一份高考數(shù)學(xué)二輪復(fù)習(xí)核心專題講練:統(tǒng)計(jì)與概率第4講 統(tǒng)計(jì)與概率綜合解答題(含解析),共52頁。試卷主要包含了,且規(guī)定計(jì)分規(guī)則如表,關(guān)于月份x的數(shù)據(jù)如表等內(nèi)容,歡迎下載使用。
這是一份高考數(shù)學(xué)二輪復(fù)習(xí)核心專題講練:統(tǒng)計(jì)與概率第3講 概率及隨機(jī)變量的分布列(含解析),共52頁。試卷主要包含了古典概型的概率計(jì)算公式,概率的基本性質(zhì),相互獨(dú)立事件的概念,條件概率,事件的相互獨(dú)立性,離散型隨機(jī)變量的均值和方差,二項(xiàng)分布,超幾何分布等內(nèi)容,歡迎下載使用。
高考數(shù)學(xué)二輪復(fù)習(xí)核心專題講練:統(tǒng)計(jì)與概率第2講 計(jì)數(shù)原理(含解析)
第1講 統(tǒng)計(jì)和統(tǒng)計(jì)案例-【沖刺雙一流】備戰(zhàn)2023年高考數(shù)學(xué)二輪復(fù)習(xí)核心專題講練(新高考版)
新高考數(shù)學(xué)二輪復(fù)習(xí) 第1部分 專題5 第1講 統(tǒng)計(jì)與統(tǒng)計(jì)案例(含解析)
專題21 統(tǒng)計(jì)與統(tǒng)計(jì)案例(練)-備戰(zhàn)高考數(shù)學(xué)二輪復(fù)習(xí)核心考點(diǎn)精講精練(新教材·新高考)
微信掃碼,快速注冊(cè)
注冊(cè)成功