
這是一份湘電子版(2019)八年級下冊第5節(jié) 體驗語音合成與人臉識別技術(shù)說課課件ppt,共27頁。PPT課件主要包含了新課導(dǎo)入,訊飛有聲,粘貼文本,當(dāng)前主播,正在播放的文本,播放功能,模擬自己的聲音,練習(xí)與思考等內(nèi)容,歡迎下載使用。
2. 使用訊飛留音生成個人聲庫
1. 掌握語音合成技術(shù)和人臉識別技術(shù)的原理
3. 使用百度人工智能服務(wù)平臺進行人臉識別分析
上節(jié)課我們了解了各種類型的人工智能技術(shù),我想考考同學(xué)們,讓人工智能實現(xiàn)“看懂”和“聽懂”的分別是什么技術(shù)?
這兩種技術(shù)分別有什么應(yīng)用?
一、體驗并探究語音合成技術(shù)
1. 體驗文本轉(zhuǎn)換為語音的技術(shù)
(1)更換主播后,聲音播放的具體內(nèi)容是否發(fā)生了變化?(2)更換主播操作究竟改變了什么?(3)從文字的錄入到語音播出,你認為經(jīng)歷了哪些過程?
2. 了解語音合成技術(shù)的主要過程
將文字信息轉(zhuǎn)換為流利的可聽懂的口語輸出技術(shù),稱為語音合成。這是一項綜合技術(shù),不僅需要計算機理解信息含義,保證信息正常輸出,還需要利用聲學(xué)相關(guān)知識,使內(nèi)容可以轉(zhuǎn)換成恰當(dāng)?shù)穆晫W(xué)模型進行語音輸出。
(1)理解文本信息的含義在語言學(xué)家和計算機科學(xué)家的共同努力下,將文本中的語法規(guī)則轉(zhuǎn)化成相應(yīng)的程序輸入計算機中,系統(tǒng)根據(jù)相應(yīng)算法,為文本進行斷句,準確獲取文本需要表達的內(nèi)容,這是文本分析的過程。
(2)韻律處理在理解文本的內(nèi)容后,通常需要考慮在讀取這段文本時使用的節(jié)奏、時長、頻率等,從而使計算機的發(fā)音更接近于人類說話的聲音。
(3)創(chuàng)建聲學(xué)模型模擬發(fā)音這個過程類似我們模仿他人聲音,需要考慮語種、音色、響度、音調(diào)等。計算機模擬的方法是在原始的語音庫中提取相關(guān)的聲音信息,采用單元合成與拼接技術(shù)將信息進行拼接,從而達到模擬發(fā)聲的效果。
(1)明確任務(wù)了解了語音合成技術(shù)的原理,同學(xué)們想不想讓程序模擬你自己的聲音呢?接下來我們利用“訊飛留聲”程序復(fù)刻自己的聲音,然后讓機器模仿自己的聲音,進行一段雙語朗誦。
(2)解決問題要點分析計算機完成對人類聲音的模仿,有以下兩個關(guān)鍵內(nèi)容:第一,形成個人的聲音庫,為計算機提供聲學(xué)模型。通過形成個人的音庫,將具有個人特色的聲學(xué)信息(音色、音調(diào)、響度等)存儲在其中,使計算機能夠提取出相關(guān)數(shù)據(jù)。第二,通過和個人音庫匹配,完成合成。通過語音合成技術(shù),在識別文本內(nèi)容的前提下,通過與個人音庫中的信息自匹配,從而使計算機可以模仿我們的聲音進行輸出。
第一步,關(guān)注微信公眾號“訊飛留聲”,選擇“復(fù)刻聲音”,進入程序。單擊“去復(fù)刻我的聲音”按鈕,開始進入工作狀態(tài)。
第二步,根據(jù)要求,朗讀 10 段文字,按“話筒鍵”開始,“停止鍵”結(jié)束。注意錄制時聲音要清晰,內(nèi)容要準確。在朗讀文字過程中,采用的是語音識別技術(shù),對我們讀取的語音進行識別,并和提供的文字進行對比。錄制聲音完成后,系統(tǒng)會自動制作并生成個人音庫。
第三步,在“訊飛留聲”的“聲音應(yīng)用一玩轉(zhuǎn)好聲音”應(yīng)用中,選擇“我是歪果仁”選項卡,選定任意一條文本,選擇個人音庫進行雙語朗誦,聽取合成聲音,也可以將聲音分享到微信群中。
(4)效果評價將生成的聲音分享到微信群,同學(xué)們互相傾聽、評價,填寫下表。
二、體驗并探究人臉識別技術(shù)
1. 體驗身邊的人臉識別技術(shù)
(1)體驗人臉識別①神奇的美顏拍攝功能很多人在拍照時喜歡使用美顏功能,有同學(xué)懂美顏功能嗎?你能給大家介紹一款帶有這類功能的智能相機應(yīng)用嗎?請你當(dāng)小老師指導(dǎo)大家一起體驗,并思考應(yīng)用程序是如何將相關(guān)裝飾和特效放到人臉各個部位的。
(1)體驗人臉識別②會分類的智能程序帶有分類功能的智能手機等設(shè)備,能自動識別照片中的面孔,根據(jù)不同的人像進行分類,使每個人都能得到一個單獨的人物相冊;如果是合影,還能自動生成“合影”標簽。分類功能是人臉識別的基礎(chǔ),我們熟悉的人臉識別、人臉解鎖相關(guān)功能都是在此基礎(chǔ)之上的應(yīng)用。
2. 了解常用的人臉識別技術(shù)
(1)人臉檢測檢測出圖像的人臉所在位置。計算機通過對圖像的完整掃描,最終標記出人臉的相關(guān)信息。
(2)人臉配準人臉配準是指在人像中準確定位五官的技術(shù)。通過人臉配準,計算機可以清晰地識別人臉圖像五官的位置。在計算機中,是通過標記一些固定的關(guān)鍵點來描繪人物的眼鼻口耳。
(3)人臉特征提取人臉特征提取是指將一張人臉圖像轉(zhuǎn)化為一串固定長度的數(shù)值的過程。這些數(shù)值用來表示人臉的特征,這些特征包含大量的人臉信息。信息包含人臉的固有屬性和動態(tài)屬性,固有屬性包括眼睛的大小、嘴巴的形狀、鼻梁的狀態(tài)、臉上是否有痣;動態(tài)屬性包括“是否在微笑、歪頭”等信息。這些數(shù)據(jù)是計算機人臉識別工作的基礎(chǔ),也是應(yīng)用的基本保障。
(4)人臉對比人臉對比是指在特征提取的基礎(chǔ)上,對比兩張圖片特征值的相似程度。通過相似程度,可以判定兩張圖片中是否包含了同一個人。這種技術(shù)在人臉解鎖、人臉簽到中被頻繁使用,
3. 利用人工智能服務(wù)平臺體驗人臉識別技術(shù)
(1)體驗百度人工智能服務(wù)平臺的人臉識別功能首先,注冊百度平臺的賬號,然后登錄該平臺,通過網(wǎng)絡(luò)版百度人工智能開放平臺網(wǎng)址或者移動終端微信小程序“百度AI 體驗中心”兩種途徑來體驗人工智能服務(wù)。任選一個平臺,選取一張人像圖片上傳,可得到相應(yīng)的分析結(jié)果。
(2)人臉識別執(zhí)行過程分析平臺是如何從圖像檢測人臉,并完成最終判定的呢?整個過程包括以下步驟:第一步,人臉檢測與定位。通過人臉檢測技術(shù)識別圖像的人臉區(qū)域,并對人的五官進行準確定位。第二步,特征提取。通過特征提取技術(shù),對圖像信息進行數(shù)字化,并用復(fù)雜的數(shù)據(jù)代碼對圖像進行描述。第三步,屬性分類。在得到人臉客觀數(shù)據(jù)的基礎(chǔ)上,通過“分類器”(可以將分類器理解成一個標準庫)中提供的大量模型對人的屬性做出判斷,如人物的年齡、表情、情緒等。
第四步,結(jié)果輸出。將判斷的答案進行公布。人工智能平臺對人臉的識別過程和人類對人臉的識別存在相似之處,同時也存在很大不同。具體差別如圖所示。
(1)導(dǎo)航軟件是如何模仿明星的聲音為我們進行導(dǎo)航的,請分析其中的原理。(2)為什么需要錄制 10 段聲音?影響效果的因素可能有哪些?(3)在上傳圖片識別照片體驗中,識別內(nèi)容包括人物的性別、年齡、膚色等。通過你的體驗和觀察,哪些內(nèi)容的結(jié)果和你預(yù)想的不一樣?結(jié)合本節(jié)探究,大膽猜想,造成這些差別的原因有哪些?
這是一份初中浙教版(2023)第6課 語音合成技術(shù)獲獎作業(yè)ppt課件,文件包含第6課語音合成技術(shù)教學(xué)課件pptx、第6課語音合成技術(shù)學(xué)習(xí)單pptx、第6課語音合成技術(shù)教學(xué)設(shè)計docx、第6課語音合成技術(shù)作業(yè)設(shè)計docx等4份課件配套教學(xué)資源,其中PPT共15頁, 歡迎下載使用。
這是一份初中信息技術(shù)浙教版(2023)八年級下冊第5課 語音識別技術(shù)優(yōu)秀作業(yè)ppt課件,文件包含第5課語音識別技術(shù)教學(xué)課件pptx、第5課語音識別技術(shù)學(xué)習(xí)單pptx、第5課語音識別技術(shù)教學(xué)設(shè)計docx、第5課語音識別技術(shù)作業(yè)設(shè)計docx等4份課件配套教學(xué)資源,其中PPT共15頁, 歡迎下載使用。
這是一份初中信息技術(shù)湘電子版(2019)八年級下冊第5節(jié) 體驗語音合成與人臉識別技術(shù)背景圖課件ppt,文件包含第5節(jié)體驗語音合成與人臉識別技術(shù)課件pptx、第5節(jié)體驗語音合成與人臉識別技術(shù)教案docx等2份課件配套教學(xué)資源,其中PPT共40頁, 歡迎下載使用。
注冊成功