[發(fā)明專利]基于語音識(shí)別的人工智能學(xué)習(xí)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201811068780.8 | 申請(qǐng)日: | 2018-09-13 |
| 公開(公告)號(hào): | CN109410911A | 公開(公告)日: | 2019-03-01 |
| 發(fā)明(設(shè)計(jì))人: | 何艷玲;王旭;騫保民;周馭讓;宋日輝;陳丹丹;趙惠;林鎮(zhèn)坤;唐芮 | 申請(qǐng)(專利權(quán))人: | 何艷玲 |
| 主分類號(hào): | G10L13/02 | 分類號(hào): | G10L13/02;G10L15/02;G10L15/16;G10L15/18;G10L15/22;G10L15/26;G06F16/332;G06Q50/26;G09B7/02 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 陳偉斌 |
| 地址: | 510275 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 人工智能 語音識(shí)別 語音識(shí)別技術(shù) 答案 學(xué)習(xí) 匹配 文本 預(yù)處理 終端 實(shí)時(shí)音頻數(shù)據(jù) 音頻特征提取 語音識(shí)別模塊 語音輸入模塊 知識(shí)庫(kù)模塊 答案發(fā)送 交互模塊 收音設(shè)備 輸出模塊 特征提取 文本分析 文本形式 學(xué)習(xí)系統(tǒng) 音頻轉(zhuǎn)化 語義分析 語音合成 原始語音 智能學(xué)習(xí) 語音 發(fā)送 智能 記錄 | ||
1.基于語音識(shí)別的人工智能學(xué)習(xí)方法,其特征在于,包括語音輸入模塊,語音識(shí)別模塊,智能問答模塊和學(xué)習(xí)系統(tǒng)輸出模塊;包括以下步驟:
S1.用戶面對(duì)學(xué)習(xí)終端以語音的形式輸入問題,終端的收音設(shè)備得到實(shí)時(shí)音頻數(shù)據(jù);
S2.通過音頻特征提取器,對(duì)原始語音進(jìn)行預(yù)處理,特征提取等操作;
S3.利用語音識(shí)別技術(shù)將音頻轉(zhuǎn)化為文本;
S4.對(duì)文本進(jìn)行語義分析并將其發(fā)送至智能學(xué)習(xí)知識(shí)庫(kù)模塊進(jìn)行答案匹配,同時(shí)記錄學(xué)員的提出的問題;
S5.通過上一步驟得到答案,對(duì)答案進(jìn)行語音合成,并將音頻、文本形式的答案發(fā)送至學(xué)習(xí)交互模塊向?qū)W習(xí)者。
2.根據(jù)權(quán)利要求1所述的基于語音識(shí)別的人工智能學(xué)習(xí)方法,其特征在于:所述的步驟S2中,具體步驟如下:
S21.預(yù)加重:
為更好消除唇齒效應(yīng)以識(shí)別語音,只保留一定頻率范圍的信號(hào),步驟如下:
s′n=sn-k*sn-1
其中,s′n為處理后的信號(hào),sn為原始信號(hào),本發(fā)明的k參數(shù)取0.9;
S22.分幀:
對(duì)原始語音信號(hào)采取分幀操作,使得每一幀都可以認(rèn)為是一段平穩(wěn)隨機(jī)過程;為了保證語音信號(hào)的連續(xù)性,每一幀之間有重疊部分,占幀長(zhǎng)的1/2;采用漢明窗進(jìn)行處理:
S23.提取MFCC特征:
首先對(duì)信號(hào)進(jìn)行快速傅里葉變換,使得時(shí)域信號(hào)轉(zhuǎn)為頻域信號(hào);其公式如下:
其中,N為采樣點(diǎn)數(shù)量,S是計(jì)算出來的信號(hào)s的連續(xù)頻譜;接著,對(duì)幅度譜加Mel濾波器組,對(duì)所有的濾波器輸出做對(duì)數(shù)運(yùn)算,再進(jìn)一步做離散余弦變換后均值方差歸一化可得MFCC特征。
3.根據(jù)權(quán)利要求1所述的基于語音識(shí)別的人工智能學(xué)習(xí)方法,其特征在于:所述的步驟S3中,分別由聲學(xué)模型建模,語言模型建模,和解碼三部分構(gòu)成;其中聲學(xué)模型用來模擬發(fā)音的概率分布,語言模型用來模擬詞語之間的關(guān)聯(lián)關(guān)系。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于何艷玲,未經(jīng)何艷玲許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811068780.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語音分析或合成;語音識(shí)別;音頻分析或處理
G10L13-00 語音合成;文本-語音合成系統(tǒng)
G10L13-02 .產(chǎn)生合成語音的方法;語音合成設(shè)備
G10L13-06 .語音合成設(shè)備中使用的基本語音單位;級(jí)聯(lián)規(guī)則
G10L13-08 .文本分析或文本以外的語音合成參數(shù)的產(chǎn)生,例如語義圖翻譯為音素、韻律產(chǎn)生、重音或聲調(diào)測(cè)定
G10L13-04 ..語音合成系統(tǒng)的零部件,例如合成設(shè)備結(jié)構(gòu)或存儲(chǔ)器管理
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人
- 語音識(shí)別系統(tǒng)和方法
- 一種語音識(shí)別測(cè)試系統(tǒng)及方法
- 一種語音識(shí)別設(shè)備的更新方法、裝置及系統(tǒng)
- 用于語音識(shí)別的方法和裝置
- 一種基于手機(jī)互聯(lián)的車載語音識(shí)別系統(tǒng)及識(shí)別方法
- 一種基于云計(jì)算與置信度計(jì)算的語音識(shí)別方法與系統(tǒng)
- 語音識(shí)別方法和裝置
- 一種用于調(diào)度機(jī)的語音識(shí)別裝置
- 語音識(shí)別方法、裝置、系統(tǒng)、電子設(shè)備和存儲(chǔ)介質(zhì)
- 模型訓(xùn)練、語音識(shí)別方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 全能語音音序識(shí)別技術(shù)
- 一種語音識(shí)別系統(tǒng)
- 語音識(shí)別方法、裝置及用戶設(shè)備
- 一種語音識(shí)別方法、裝置及設(shè)備
- 一種面向邊緣設(shè)備的語音識(shí)別-合成聯(lián)合的建模方法
- 設(shè)備的語音識(shí)別方法和裝置
- 語音識(shí)別文本的校正方法及裝置
- 一種語音識(shí)別方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品
- 語音識(shí)別模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 語音助手識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 用于智能問答系統(tǒng)的答案排序方法及裝置
- 一種基于串謀檢測(cè)的眾包結(jié)果匯聚方法及裝置
- 一種面向問答領(lǐng)域動(dòng)態(tài)計(jì)算問句與答案相似性的方法
- 一種基于數(shù)據(jù)處理的眾包任務(wù)答案確定方法及相關(guān)設(shè)備
- 一種手寫答案識(shí)別批改方法及裝置
- 一種答案批改方法及裝置
- 一種面向閱讀理解問答的多角度答案驗(yàn)證方法
- 一種訓(xùn)練文本關(guān)鍵內(nèi)容提取模型的方法和系統(tǒng)
- 填空題標(biāo)準(zhǔn)答案確定方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 互動(dòng)游戲書





