[發(fā)明專(zhuān)利]語(yǔ)音指令檢測(cè)模型構(gòu)建方法、檢測(cè)方法及系統(tǒng)、人機(jī)交互方法及設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 201610615977.3 | 申請(qǐng)日: | 2016-07-29 |
| 公開(kāi)(公告)號(hào): | CN107665704B | 公開(kāi)(公告)日: | 2020-09-11 |
| 發(fā)明(設(shè)計(jì))人: | 吳奎;陳凌輝;黃鑫;陳志剛;王智國(guó);胡郁;劉慶峰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 科大訊飛股份有限公司 |
| 主分類(lèi)號(hào): | G10L15/06 | 分類(lèi)號(hào): | G10L15/06;G10L25/48;G06F3/16;G06F40/30 |
| 代理公司: | 北京維澳專(zhuān)利代理有限公司 11252 | 代理人: | 趙景平;宋少華 |
| 地址: | 230088 安徽省*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音 指令 檢測(cè) 模型 構(gòu)建 方法 系統(tǒng) 人機(jī)交互 設(shè)備 | ||
本發(fā)明公開(kāi)了一種語(yǔ)音指令檢測(cè)模型構(gòu)建方法,該方法包括:確定語(yǔ)音指令檢測(cè)模型的拓?fù)浣Y(jié)構(gòu);收集大量人機(jī)交互的語(yǔ)音數(shù)據(jù)及其對(duì)應(yīng)的識(shí)別文本;對(duì)所述識(shí)別文本中用戶(hù)提問(wèn)或回答語(yǔ)句文本進(jìn)行分詞,并以單輪回答或提問(wèn)為單位,獲取分詞詞串;對(duì)所述分詞詞串中的每個(gè)詞,依據(jù)對(duì)話(huà)歷史信息,依次對(duì)各詞進(jìn)行語(yǔ)音指令結(jié)束點(diǎn)賦值,并標(biāo)注業(yè)務(wù)類(lèi)別、以及信息槽或狀態(tài)槽;利用所述識(shí)別文本及其賦值信息和標(biāo)注信息,訓(xùn)練得到語(yǔ)音指令檢測(cè)模型的參數(shù)。本發(fā)明還公開(kāi)了一種語(yǔ)音指令檢測(cè)方法及系統(tǒng)、以及一種人機(jī)交互方法及設(shè)備。本發(fā)明可以提高語(yǔ)音指令點(diǎn)檢測(cè)的準(zhǔn)確性,進(jìn)而提高人機(jī)交互過(guò)程中機(jī)器響應(yīng)的成功率及響應(yīng)速度。
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音信號(hào)處理、人機(jī)交互領(lǐng)域,具體涉及一種語(yǔ)音指令檢測(cè)模型構(gòu)建方法、一種語(yǔ)音指令檢測(cè)方法及系統(tǒng)、以及一種人機(jī)交互方法及設(shè)備。
背景技術(shù)
隨著人工智能技術(shù)的進(jìn)步,人機(jī)語(yǔ)音交互也取得了長(zhǎng)足的發(fā)展,各種語(yǔ)音助手APP和人機(jī)交互機(jī)器人大肆興起。這些語(yǔ)音助手和機(jī)器人與用戶(hù)進(jìn)行交互的流程通常如下:
(1)通過(guò)語(yǔ)音或者設(shè)定操作進(jìn)行喚醒;
(2)通過(guò)語(yǔ)音數(shù)據(jù)的停頓時(shí)長(zhǎng)判斷用戶(hù)是否說(shuō)完;
(3)檢測(cè)到用戶(hù)說(shuō)完后,將識(shí)別結(jié)果傳入語(yǔ)義理解引擎,進(jìn)行語(yǔ)義理解;
(4)根據(jù)語(yǔ)義理解結(jié)果,系統(tǒng)做出響應(yīng)。
現(xiàn)有交互系統(tǒng)中,僅通過(guò)語(yǔ)音數(shù)據(jù)的停頓時(shí)長(zhǎng)檢測(cè)語(yǔ)音指令的結(jié)束點(diǎn),確定交互指令是否完整,為此需要設(shè)定停頓時(shí)長(zhǎng)閾值,判斷應(yīng)用是否說(shuō)完,即根據(jù)語(yǔ)音數(shù)據(jù)的停頓時(shí)長(zhǎng)是否大于閾值來(lái)確定語(yǔ)音指令結(jié)束點(diǎn)的位置,得到相應(yīng)語(yǔ)音指令后,進(jìn)行語(yǔ)音識(shí)別及自然語(yǔ)言理解,給出相應(yīng)反饋。這種設(shè)定硬性閾值的方式會(huì)導(dǎo)致由于語(yǔ)音指令內(nèi)部的長(zhǎng)停頓導(dǎo)致語(yǔ)音指令被截?cái)嗟那闆r,嚴(yán)重影響語(yǔ)音識(shí)別及語(yǔ)義理解;此外,當(dāng)語(yǔ)音數(shù)據(jù)中存在噪聲等干擾因素時(shí),很難準(zhǔn)確檢測(cè)到語(yǔ)音數(shù)據(jù)的停頓位置,造成語(yǔ)音指令結(jié)束點(diǎn)檢測(cè)產(chǎn)生較大延遲,嚴(yán)重影響用戶(hù)體驗(yàn)。
發(fā)明內(nèi)容
針對(duì)上述現(xiàn)有技術(shù)通過(guò)語(yǔ)音數(shù)據(jù)的停頓時(shí)長(zhǎng)進(jìn)行語(yǔ)音指令結(jié)束點(diǎn)檢測(cè)存在的問(wèn)題,本發(fā)明一方面提供一種語(yǔ)音指令檢測(cè)模型構(gòu)建方法、以及一種基于語(yǔ)音指令檢測(cè)模型的語(yǔ)音指令檢測(cè)方法及系統(tǒng),以避免由于語(yǔ)音指令內(nèi)部的長(zhǎng)停頓導(dǎo)致語(yǔ)音指令被截?cái)嗟膯?wèn)題,并防止噪聲等干擾因素對(duì)語(yǔ)音指令結(jié)束點(diǎn)檢測(cè)的影響。
本發(fā)明另一方面提供一種人機(jī)交互方法及設(shè)備,以提高人機(jī)交互過(guò)程中機(jī)器響應(yīng)的成功率及響應(yīng)速度。
為此,本發(fā)明實(shí)施例提供如下技術(shù)方案:
一種語(yǔ)音指令檢測(cè)模型構(gòu)建方法,包括:
確定語(yǔ)音指令檢測(cè)模型的拓?fù)浣Y(jié)構(gòu);
收集大量人機(jī)交互的文本數(shù)據(jù)作為訓(xùn)練數(shù)據(jù);
對(duì)所述訓(xùn)練數(shù)據(jù)中用戶(hù)提問(wèn)或回答語(yǔ)句文本進(jìn)行分詞,并以單輪回答或提問(wèn)為單位,獲取分詞詞串;
對(duì)所述分詞詞串中的每個(gè)詞,依據(jù)對(duì)話(huà)歷史信息,依次對(duì)各詞進(jìn)行語(yǔ)音指令結(jié)束點(diǎn)賦值,并標(biāo)注業(yè)務(wù)類(lèi)別、以及信息槽或狀態(tài)槽,所述信息槽表示業(yè)務(wù)當(dāng)前所包含的信息單元,所述狀態(tài)槽表示業(yè)務(wù)當(dāng)前的狀態(tài)信息;
利用所述訓(xùn)練數(shù)據(jù)及其賦值信息和標(biāo)注信息,訓(xùn)練得到語(yǔ)音指令檢測(cè)模型的參數(shù)。
優(yōu)選地,所述語(yǔ)音指令檢測(cè)模型的拓?fù)浣Y(jié)構(gòu)采用RNN模型,包括輸入層、中間隱層和輸出層;
所述輸入層的輸入包括:當(dāng)前詞的詞向量wn(t)、截止到上一個(gè)詞的隱層向量h(t-1)、對(duì)話(huà)歷史信息,其中,所述對(duì)話(huà)歷史信息包括:截止到上一個(gè)詞的業(yè)務(wù)分類(lèi)信息c(t-1)、以及信息槽填充情況s(t-1)或狀態(tài)槽填充情況st(t-1);所述輸出層的輸出包括:檢測(cè)結(jié)果p(t),所述檢測(cè)結(jié)果p(t)具體為當(dāng)前詞為語(yǔ)音指令結(jié)束點(diǎn)的概率得分、或者為表征當(dāng)前詞是否為語(yǔ)音指令結(jié)束點(diǎn)的數(shù)值。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610615977.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種多用戶(hù)的音頻合成方法和系統(tǒng)以及遠(yuǎn)程服務(wù)器
- 下一篇:語(yǔ)音關(guān)鍵詞識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話(huà)者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)





