[發明專利]語句識別方法及裝置有效
| 申請號: | 201910926305.8 | 申請日: | 2019-09-27 |
| 公開(公告)號: | CN110674314B | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 韓磊;張紅陽 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/295;G06N3/02;G06N3/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 王萌 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 識別 方法 裝置 | ||
本申請公開了語句識別方法及裝置,涉及人機交互技術領域。具體實現方案為:獲取待識別的語句以及對應的特征信息,特征信息包括:語句的分詞結果、詞性識別結果以及實體識別結果;獲取訓練好的對話理解模型,對話理解模型包括:主干神經網絡,與主干神經網絡連接的槽位分支,與主干神經網絡連接的池化層,與池化層分別連接的意圖分支和意圖槽位關系分支;將特征信息輸入訓練好的對話理解模型,獲取語句的意圖和槽位,從而通過在對話理解模型中添加意圖槽位關系分支,使得對話理解模型在訓練或者語句識別時能夠考慮到意圖和槽位之間的關系,提高輸出的意圖和槽位之間的匹配度,提高對話理解模型的語句識別效率。
技術領域
本申請涉及數據處理技術領域,具體涉及人機交互技術領域,尤其涉及語言識別方法及裝置。
背景技術
目前的對話理解模型,包括有意圖分支和槽位分支;意圖分支和槽位分支共享部分模型系數。對話理解模型在進行訓練時,基于意圖分類和槽位標注兩個目標函數同時進行訓練,但這種訓練方法,導致對話理解模型在對語句進行識別時,輸出的意圖和槽位容易存在不匹配的問題,降低了對話理解模型的語句識別效率。
發明內容
本申請提出一種語句識別方法及裝置,通過在對話理解模型中添加意圖槽位關系分支,使得對話理解模型在訓練或者語句識別時能夠考慮到意圖和槽位之間的關系,提高輸出的意圖和槽位之間的匹配度,提高語句識別效率。
本申請一方面實施例提出了一種語句識別方法,包括:獲取待識別的語句以及對應的特征信息,所述特征信息包括:所述語句的分詞結果、詞性識別結果以及實體識別結果;獲取訓練好的對話理解模型,所述對話理解模型包括:主干神經網絡,與所述主干神經網絡連接的槽位分支,與所述主干神經網絡連接的池化層,與所述池化層分別連接的意圖分支和意圖槽位關系分支;將所述特征信息輸入訓練好的對話理解模型,獲取所述語句的意圖和槽位。
在本申請一個實施例中,所述主干神經網絡包括:依次連接的嵌入層、向量拼接層和雙向神經網絡;所述槽位分支包括:依次連接的第一全連接層和條件隨機場網絡;所述意圖分支包括:依次連接第二全連接層和第一分類網絡;所述意圖槽位關系分支包括:依次連接的第三全連接層和第二分類網絡。
在本申請一個實施例中,所述將所述特征信息輸入訓練好的對話理解模型,獲取所述語句的意圖和槽位,包括:將所述特征信息輸入訓練好的對話理解模型,獲取所述語句的意圖,以及所述分詞結果中各個分詞的槽位類型;根據所述分詞結果中各個分詞的槽位類型,確定所述語句的槽位。
在本申請一個實施例中,所述獲取訓練好的對話理解模型,包括:獲取訓練數據和初始的對話理解模型,所述訓練數據包括:多個語句樣本,語句樣本對應的特征信息,以及語句樣本的實際意圖和實際槽位;采用所述訓練數據對初始的對話理解模型進行訓練,直至目標函數的數值小于預設閾值,得到訓練好的對話理解模型;所述目標函數結合意圖分支、槽位分支和意圖槽位關系分支的輸出建立。
本申請實施例的語句識別方法,通過獲取待識別的語句以及對應的特征信息,特征信息包括:語句的分詞結果、詞性識別結果以及實體識別結果;獲取訓練好的對話理解模型,對話理解模型包括:主干神經網絡,與主干神經網絡連接的槽位分支,與主干神經網絡連接的池化層,與池化層分別連接的意圖分支和意圖槽位關系分支;將特征信息輸入訓練好的對話理解模型,獲取語句的意圖和槽位,從而通過在對話理解模型中添加意圖槽位關系分支,使得對話理解模型在訓練或者語句識別時能夠考慮到意圖和槽位之間的關系,提高輸出的意圖和槽位之間的匹配度,提高對話理解模型的語句識別效率。
本申請另一方面實施例提出了一種語句識別裝置,包括:獲取模塊,用于獲取待識別的語句以及對應的特征信息,所述特征信息包括:所述語句的分詞結果、詞性識別結果以及實體識別結果;所述獲取模塊,還用于獲取訓練好的對話理解模型,所述對話理解模型包括:主干神經網絡,與所述主干神經網絡連接的槽位分支,與所述主干神經網絡連接的池化層,與所述池化層分別連接的意圖分支和意圖槽位關系分支;輸入模塊,用于將所述特征信息輸入訓練好的對話理解模型,獲取所述語句的意圖和槽位。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910926305.8/2.html,轉載請聲明來源鉆瓜專利網。





