[發(fā)明專利]基于雙模型識別的語音領(lǐng)域命令理解方法在審
| 申請?zhí)枺?/td> | 201811076254.6 | 申請日: | 2018-09-14 |
| 公開(公告)號: | CN109192201A | 公開(公告)日: | 2019-01-11 |
| 發(fā)明(設(shè)計(jì))人: | 段禮強(qiáng);李賢;樂雨泉 | 申請(專利權(quán))人: | 蘇州亭云智能科技有限公司 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16;G10L15/08;G10L15/22 |
| 代理公司: | 北京輕創(chuàng)知識產(chǎn)權(quán)代理有限公司 11212 | 代理人: | 談杰 |
| 地址: | 215000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音領(lǐng)域 條件隨機(jī)場模型 循環(huán)神經(jīng)網(wǎng)絡(luò) 模型識別 語音 話語 后處理單元 控制指令 模型處理 目標(biāo)序列 判斷結(jié)果 出錯率 試題 標(biāo)簽 輸出 外部 | ||
本發(fā)明涉及一種基于雙模型識別的語音領(lǐng)域命令理解方法,外部輸入話語先經(jīng)循環(huán)神經(jīng)網(wǎng)絡(luò)模型處理并進(jìn)行語音意圖的判斷,在得出判斷結(jié)果后再經(jīng)條件隨機(jī)場模型生成目標(biāo)序列標(biāo)簽,從而提取出語音實(shí)體,所述條件隨機(jī)場模型再向后處理單元輸出所提取到的語音試題的數(shù)據(jù),生成最終的控制指令。本發(fā)明中的循環(huán)神經(jīng)網(wǎng)絡(luò)模型的目標(biāo)是為判斷用戶的話語是否表達(dá)了一個語音領(lǐng)域的意圖,如此能夠提高識別準(zhǔn)確性,降低識別出錯率。
技術(shù)領(lǐng)域
本發(fā)明涉及人機(jī)交互領(lǐng)域中的語言識別技術(shù)領(lǐng)域,特別是涉及一張基于雙模型識別的語音領(lǐng)域命令理解方法
背景技術(shù)
對話系統(tǒng)是人機(jī)交互的一種相當(dāng)重要的形式,也是自然語言處理過程中的一個關(guān)鍵的研究方向。在語音領(lǐng)域,能否正確解析出用戶話語命令是完成用戶指定任務(wù)的基礎(chǔ),在很多地方比如語音助手、語音平臺都有很豐富的應(yīng)用場景。
對于用戶某條話語,目前常使用的條件隨機(jī)場(CRF)模型并不能很好的區(qū)分其是否表達(dá)了一個語音領(lǐng)域內(nèi)的意圖。CRF一般在序列標(biāo)注、命名實(shí)體識別過程表現(xiàn)較好,但在識別語音實(shí)體之前,需要判斷此用戶話語是否表達(dá)語音意圖,否則可能識別出錯,甚至無法識別。
如能夠先進(jìn)行語音意圖的識別,可帶來兩個好處,一是若判斷用戶話語沒有表達(dá)語音意圖,則不需要進(jìn)行后續(xù)實(shí)體提取操作,因?yàn)榇藭r已經(jīng)完成無語音意圖解析操作,二是若對用戶話語的語音意圖不做判斷的話,則很有可能一段用戶話語沒有表現(xiàn)語音意圖,但是被錯誤的提取出了語音實(shí)體,比如“劉德華的老婆是誰”這句用戶話語,若不先進(jìn)行語音意圖判斷操作,則很有可能將“劉德華”識別成歌手實(shí)體,從而這句話也被解析成語音意圖,而實(shí)際上這句話并沒有表達(dá)語音領(lǐng)域的相關(guān)意圖。
發(fā)明內(nèi)容
本發(fā)明的目的是要提供一種基于雙模型識別的語音領(lǐng)域命令理解方法,其中循環(huán)神經(jīng)網(wǎng)絡(luò)模型的目標(biāo)是為判斷用戶的話語是否表達(dá)了一個語音領(lǐng)域的意圖,如此能夠提高識別準(zhǔn)確性,降低識別出錯率。
為達(dá)到上述目的,本發(fā)明采用的技術(shù)方案是:
本發(fā)明提供了一種基于雙模型識別的語音領(lǐng)域命令理解方法,外部輸入話語先經(jīng)循環(huán)神經(jīng)網(wǎng)絡(luò)模型處理并進(jìn)行語音意圖的判斷,在得出判斷結(jié)果后再經(jīng)條件隨機(jī)場模型生成目標(biāo)序列標(biāo)簽,從而提取出語音實(shí)體,所述條件隨機(jī)場模型再向后處理單元輸出所提取到的語音試題的數(shù)據(jù),生成最終的控制指令。
對于上述技術(shù)方案,申請人還有進(jìn)一步的實(shí)施方案。
進(jìn)一步地,外部輸入話語先經(jīng)分子處理單元對其進(jìn)行按字切分后形成初始訓(xùn)練集,再將初始訓(xùn)練集輸入所述循環(huán)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行處理。
更進(jìn)一步地,在循環(huán)神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行處理的具體步驟如下:
步驟A1:計(jì)算第t時刻的隱藏狀態(tài)ht,ht由上一層的隱藏狀態(tài)和本層的輸入共同決定,
ht=f(Uxt+Wht-1)其中,xt是第t時刻的輸入,f為非線性的激活函數(shù),U、W為變換矩陣;
步驟A2:計(jì)算預(yù)測標(biāo)簽值S,
S=sigmod(VhT),其中,V為變換矩陣,hT為序列最后一個時刻的隱藏狀態(tài);
步驟A3:確定分類類型,
根據(jù)預(yù)測標(biāo)簽值S確定分類,如S為正值則分類為正類,確認(rèn)外部輸入話語為語音意圖,繼續(xù)進(jìn)入條件隨機(jī)場模型進(jìn)行處理,如S為負(fù)值則分類為負(fù)類,確認(rèn)外部輸入話語為非語音意圖,退出此次處理。
進(jìn)一步地,在條件隨機(jī)場模型中進(jìn)行處理時,外部輸入為句子序列,輸出目標(biāo)為句子標(biāo)注序列標(biāo)簽,然后根據(jù)標(biāo)注序列標(biāo)簽提取對應(yīng)的語音實(shí)體。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州亭云智能科技有限公司,未經(jīng)蘇州亭云智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811076254.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于深度神經(jīng)網(wǎng)絡(luò)與條件隨機(jī)場的對話行為識別方法
- 一種事件觸發(fā)詞識別方法及裝置
- 基于反饋式條件隨機(jī)場的G蛋白偶聯(lián)受體拓?fù)溆?jì)算預(yù)測方法
- 半監(jiān)督的高光譜遙感圖像分類標(biāo)注方法
- 基于三層條件隨機(jī)場的疾病數(shù)據(jù)命名實(shí)體識別方法及系統(tǒng)
- 基于條件隨機(jī)場圖結(jié)構(gòu)學(xué)習(xí)的語義圖像分割方法
- 基于條件隨機(jī)場與Stacking算法的時間序列預(yù)測方法和裝置
- 一種基于局部區(qū)域條件隨機(jī)場模型的圖像語義分割方法
- 基于兩層全連接條件隨機(jī)場模型的深度圖結(jié)構(gòu)修復(fù)方法
- 數(shù)據(jù)驅(qū)動的電動汽車充電需求的時空價格彈性估計(jì)方法
- 用于識別字跡的方法、裝置及計(jì)算機(jī)可讀介質(zhì)
- 基于層級神經(jīng)網(wǎng)絡(luò)的圖像-句子描述生成系統(tǒng)及方法
- 基于差異循環(huán)神經(jīng)網(wǎng)絡(luò)的意圖識別方法
- 一種基于深度學(xué)習(xí)大規(guī)模病歷的輔助診斷系統(tǒng)
- 一種改進(jìn)鯨魚算法的循環(huán)神經(jīng)網(wǎng)絡(luò)短期電力負(fù)荷預(yù)測方法
- 基于門控循環(huán)神經(jīng)網(wǎng)絡(luò)的非線性均衡方法
- 一種基于卷積核相似性剪枝的循環(huán)神經(jīng)網(wǎng)絡(luò)模型壓縮方法
- 一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)對動態(tài)磁滯進(jìn)行補(bǔ)償?shù)姆椒跋到y(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測方法
- 一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的駕駛?cè)硕嗖僮髌谔卣魈崛》椒?/a>





