[發明專利]意圖識別方法及裝置、存儲介質、終端有效
| 申請號: | 201910356912.5 | 申請日: | 2019-04-29 |
| 公開(公告)號: | CN110097886B | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 李杭泰 | 申請(專利權)人: | 貴州小愛機器人科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張振軍;吳敏 |
| 地址: | 550017 貴州省貴陽市白*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 意圖 識別 方法 裝置 存儲 介質 終端 | ||
1.一種意圖識別方法,其特征在于,包括:
對用戶的當前語音識別結果進行初始意圖識別,所述當前語音識別結果為文本數據;
在初始意圖識別失敗時,確定所述當前語音識別結果包含的字的數量,字為所述文本數據中具備語義的最小單元;
在所述字的數量達到預設門限時,對所述當前語音識別結果進行拆分,以得到M個句子,M為大于1的正整數;
分別對所述M個句子進行意圖識別,以獲得N個意圖,N為正整數且小于等于M;
至少根據所述N個意圖確定所述當前語音識別結果的意圖;
在所述字的數量未達到預設門限時,判斷所述當前語音識別結果之前的前語音識別結果包含的字的數量是否達到預設門限,以及意圖識別是否成功;如果所述前語音識別結果包含的字的數量未達到預設門限且意圖識別失敗,則將所述當前語音識別結果存儲至句子列表緩存,如果所述句子列表緩存中的識別結果的數量大于1,則將所述句子列表緩存中所有的語音識別結果進行合并;
利用合并后的語音識別結果進行意圖識別。
2.根據權利要求1所述的意圖識別方法,其特征在于,N為大于等于2的正整數,所述至少根據所述N個意圖確定所述當前語音識別結果對應的意圖包括:
計算獲得所述N個意圖的句子的重要度;
選取所述重要度最高的句子的意圖作為所述當前語音識別結果的意圖。
3.根據權利要求2所述的意圖識別方法,其特征在于,所述計算獲得所述N個意圖的N個句子的重要度包括:
分別計算所述N個句子的詞頻逆文檔頻率,以分別作為所述N個句子的重要度。
4.根據權利要求1所述的意圖識別方法,其特征在于,所述至少根據所述N個意圖確定所述當前語音識別結果對應的意圖包括:
確定獲得所述N個意圖的句子在所述當前語音識別結果中的位置;
選取所述位置最靠后的句子的意圖作為所述當前語音識別結果的意圖。
5.根據權利要求1所述的意圖識別方法,其特征在于,所述對所述當前語音識別結果進行拆分包括:
采用預設正則表達式對所述當前語音識別結果進行拆分。
6.根據權利要求1所述的意圖識別方法,其特征在于,所述對所述當前語音識別結果進行拆分之前還包括:
判斷所述當前語音識別結果是否按照標點符號進行斷句;
如果所述當前語音識別結果未被按照標點符號進行斷句,則利用預先訓練完成的斷句模型對所述當前語音識別結果進行斷句。
7.根據權利要求1所述的意圖識別方法,其特征在于,還包括:
如果對合并后的語音識別結果的意圖識別成功,則清空所述句子列表緩存;或者,如果所述前語音識別結果包含的字的數量達到預設門限或者意圖識別成功,則清空所述句子列表緩存。
8.根據權利要求1所述的意圖識別方法,其特征在于,所述利用合并后的語音識別結果進行意圖識別包括:
計算所述合并后的語音識別結果的通順度;
如果所述通順度達到預設閾值,則利用所述合并后的語音識別結果進行意圖識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貴州小愛機器人科技有限公司,未經貴州小愛機器人科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910356912.5/1.html,轉載請聲明來源鉆瓜專利網。





