[發(fā)明專利]意圖識別方法及裝置、存儲介質(zhì)、終端有效
| 申請?zhí)枺?/td> | 201910356912.5 | 申請日: | 2019-04-29 |
| 公開(公告)號: | CN110097886B | 公開(公告)日: | 2021-09-10 |
| 發(fā)明(設(shè)計)人: | 李杭泰 | 申請(專利權(quán))人: | 貴州小愛機器人科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 張振軍;吳敏 |
| 地址: | 550017 貴州省貴陽市白*** | 國省代碼: | 貴州;52 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 意圖 識別 方法 裝置 存儲 介質(zhì) 終端 | ||
一種意圖識別方法及裝置、存儲介質(zhì)、終端,意圖識別方法包括:對用戶的當前語音識別結(jié)果進行初始意圖識別,所述當前語音識別結(jié)果為文本數(shù)據(jù);在初始意圖識別失敗時,確定所述當前語音識別結(jié)果包含的字的數(shù)量,字為所述文本數(shù)據(jù)中具備語義的最小單元;在所述字的數(shù)量達到預(yù)設(shè)門限時,對所述當前語音識別結(jié)果進行拆分,以得到M個句子,M為大于1的正整數(shù);分別對所述M個句子進行意圖識別,以獲得N個意圖,N為正整數(shù)且小于等于M;至少根據(jù)所述N個意圖確定所述當前語音識別結(jié)果的意圖。本發(fā)明技術(shù)方案能夠提升意圖識別的準確率。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種意圖識別方法及裝置、存儲介質(zhì)、終端。
背景技術(shù)
在使用語音的方式進行人機交互的過程中,現(xiàn)有技術(shù)對于用戶輸入的語音數(shù)據(jù),利用語音引擎進行語音識別。并將語音識別獲得的全部內(nèi)容,直接作為語義理解引擎的輸入,以獲得用戶的意圖。
但是,相比直接的文字輸入的交互方式,語音交互要復(fù)雜得多。在語音交互場景存在以下情況:用戶單次語音交互的內(nèi)容太多(例如超過20字);語音引擎對句子,尤其是超過20字的句子沒有進行斷句;用戶說話斷斷續(xù)續(xù),語音識別引擎單次拾音的內(nèi)容不構(gòu)成句子。在上述三種情況下,也即在長句子、長句子無斷句和內(nèi)容不構(gòu)成句子的情況下,無法識別用戶的意圖,降低用戶體驗。
發(fā)明內(nèi)容
本發(fā)明解決的技術(shù)問題是如何提升意圖識別的準確率。
為解決上述技術(shù)問題,本發(fā)明實施例提供一種意圖識別方法,意圖識別方法包括:對用戶的當前語音識別結(jié)果進行初始意圖識別,所述當前語音識別結(jié)果為文本數(shù)據(jù);在初始意圖識別失敗時,確定所述當前語音識別結(jié)果包含的字的數(shù)量,字為所述文本數(shù)據(jù)中具備語義的最小單元;在所述字的數(shù)量達到預(yù)設(shè)門限時,對所述當前語音識別結(jié)果進行拆分,以得到M個句子,M為大于1的正整數(shù);分別對所述M個句子進行意圖識別,以獲得N個意圖,N為正整數(shù)且小于等于M;至少根據(jù)所述N個意圖確定所述當前語音識別結(jié)果的意圖。
可選的,N為大于等于2的正整數(shù),所述至少根據(jù)所述N個意圖確定所述當前語音識別結(jié)果對應(yīng)的意圖包括:計算獲得所述N個意圖的句子的重要度;選取所述重要度最高的句子的意圖作為所述當前語音識別結(jié)果的意圖。
可選的,所述計算獲得所述N個意圖的N個句子的重要度包括:分別計算所述N個句子的詞頻逆文檔頻率,以分別作為所述N個句子的重要度。
可選的,所述至少根據(jù)所述N個意圖確定所述當前語音識別結(jié)果對應(yīng)的意圖包括:確定獲得所述N個意圖的句子在所述當前語音識別結(jié)果中的位置;選取所述位置最靠后的句子的意圖作為所述當前語音識別結(jié)果的意圖。
可選的,所述對所述當前語音識別結(jié)果進行拆分包括:采用預(yù)設(shè)正則表達式對所述當前語音識別結(jié)果進行拆分。
可選的,所述對所述當前語音識別結(jié)果進行拆分之前還包括:判斷所述當前語音識別結(jié)果是否按照標點符號進行斷句;如果所述當前語音識別結(jié)果未被按照標點符號進行斷句,則利用預(yù)先訓練完成的斷句模型對所述當前語音識別結(jié)果進行斷句。
可選的,所述意圖識別方法還包括:在所述字的數(shù)量未達到預(yù)設(shè)門限時,判斷所述當前語音識別結(jié)果之前的前語音識別結(jié)果包含的字的數(shù)量是否達到預(yù)設(shè)門限,以及意圖識別是否成功;如果所述前語音識別結(jié)果包含的字的數(shù)量未達到預(yù)設(shè)門限且意圖識別失敗,則至少將所述當前語音識別結(jié)果與所述前語音識別結(jié)果進行合并;利用合并后的語音識別結(jié)果進行意圖識別。
可選的,所述至少將所述當前語音識別結(jié)果與所述前語音識別結(jié)果進行合并包括:將所述當前語音識別結(jié)果存儲至句子列表緩存;如果所述句子列表緩存中的識別結(jié)果的數(shù)量大于1,則將所述句子列表緩存中所有的語音識別結(jié)果進行合并。
可選的,所述意圖識別方法還包括:如果對合并后的語音識別結(jié)果的意圖識別成功,則清空所述句子列表緩存;或者,如果所述前語音識別結(jié)果包含的字的數(shù)量達到預(yù)設(shè)門限或者意圖識別成功,則清空所述句子列表緩存。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于貴州小愛機器人科技有限公司,未經(jīng)貴州小愛機器人科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910356912.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于意圖挖掘的方法和設(shè)備
- 意圖估計裝置以及意圖估計方法
- 意圖識別方法、裝置、設(shè)備及計算機可讀介質(zhì)
- 意圖確認方法及裝置
- 搜索意圖識別方法、裝置、電子設(shè)備和存儲介質(zhì)
- 語句多意圖識別方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 對話系統(tǒng)中意圖沖突的解決方法、系統(tǒng)及裝置
- 信息通信網(wǎng)絡(luò)的意圖轉(zhuǎn)譯方法、系統(tǒng)、介質(zhì)及交互接口
- 語音對話的意圖識別方法、系統(tǒng)、設(shè)備及存儲介質(zhì)
- 意圖識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)





