[發明專利]語句解析方法、裝置、計算機設備及可讀介質有效
| 申請號: | 201810193537.2 | 申請日: | 2018-03-09 |
| 公開(公告)號: | CN108549656B | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 陳立瑋;劉瓊瓊;丁鑫哲;孫珂 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06F40/30 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 解析 方法 裝置 計算機 設備 可讀 介質 | ||
1.一種語句解析方法,其特征在于,所述方法包括:
獲取待解析的目標語句對應的啟發式理解的特征信息,所述啟發式理解的特征信息包括第一啟發式理解的特征信息,所述第一啟發式理解的特征信息的獲取過程包括:將預設的多個語義片段規則組與所述目標語句進行匹配后獲得所述目標語句對應的多種候選解析結果,其中,各所述候選解析結果包括:所述目標語句對應的候選意圖和候選槽位;各所述語義片段規則組分別對應一種意圖,各所述語義片段規則組中包括多個槽位以及各所述槽位的順序標識;各所述語義片段規則組用于替代多個模板,每個模板對應一種句式;所述候選槽位為所述目標語句中包括的所述語義片段規則組中的槽位,所述候選意圖為所述候選槽位所在的語義片段規則組對應的意圖;以及,獲取所述目標語句的命中各所述候選槽位的片段的順序標識是否滿足對應的所述語義片段規則組中的限定的特征、所述目標語句中是否包括對應的候選意圖對應的特定片段的特征、和所述目標語句的候選理解的識別覆蓋率的特征;
根據所述目標語句對應的啟發式理解的特征信息,解析所述目標語句的多種候選解析結果以及各種所述候選解析結果對應的置信度,包括:若所述特征信息為兩個以上,神經網絡模型按照各特征信息的權重,解析所述目標語句的多種候選解析結果,并計算各種候選解析結果的置信度,輸出每種候選解析結果以及對應的置信度;
根據各種所述候選解析結果以及各種所述候選解析結果的置信度,確定所述目標語句對應的目標理解,包括:若置信度最大的所述候選解析結果包括至少兩個時,從最大的至少兩個置信度對應的至少兩個候選解析結果中獲取所述候選槽位的數量最多的所述候選解析結果,作為所述目標語句對應的目標理解。
2.根據權利要求1所述的方法,其特征在于,獲取待解析的目標語句對應的啟發式理解的特征信息,還包括:
基于預標注的訓練語句數據集,獲取所述目標語句對應的第二啟發式理解的特征信息;所述預標注的訓練語句數據集中包括多條訓練語句,各所述訓練語句中已標注對應的意圖和槽位;
對應地,根據所述目標語句對應的啟發式理解的特征信息,解析所述目標語句的多種候選解析結果以及各種所述候選解析結果對應的置信度,具體包括:
根據所述第一啟發式理解的特征信息和/或所述啟發式理解的第二特征信息,獲取所述目標語句的多種候選解析結果以及各種所述候選解析結果對應的置信度。
3.根據權利要求1所述的方法,其特征在于,根據所述第一啟發式理解的特征信息,解析所述目標語句的多種候選解析結果以及各種所述候選解析結果對應的置信度,具體包括:
根據所述目標語句的命中各所述候選槽位的片段的順序標識是否滿足對應的所述語義片段規則組中的限定的特征、所述目標語句中是否包括對應的候選意圖對應的特定片段的特征、和所述目標語句的候選理解的識別覆蓋率的特征中的至少一種,解析所述目標語句的多種候選解析結果以及各種所述候選解析結果對應的置信度;或者
根據所述目標語句的命中各所述候選槽位的片段的順序標識是否滿足對應的所述語義片段規則組中的限定的特征、所述目標語句中是否包括對應的候選意圖對應的特定片段的特征、和所述目標語句的候選理解的識別覆蓋率的特征以及預先為各所述特征配置的權重,解析所述目標語句的多種候選解析結果以及各種所述候選解析結果對應的置信度。
4.根據權利要求2所述的方法,其特征在于,基于預標注的訓練語句數據集,獲取所述目標語句對應的第二啟發式理解的特征信息,具體包括如下至少一種:
基于所述預標注的訓練語句數據集,獲取所述目標語句中的每個詞語對應的各候選槽位的槽位與意圖的相關性特征;
基于所述預標注的訓練語句數據集,獲取所述目標語句中的每個詞語對應的各候選槽位的槽位普及程度特征;
基于所述預標注的訓練語句數據集,獲取所述目標語句中的每個詞語對應的詞語與槽位的相關性特征;
基于所述預標注的訓練語句數據集,獲取所述目標語句中的不同詞語對應的候選槽位間的槽位與槽位的相關性特征;和/或
基于所述預標注的訓練語句數據集,獲取所述目標語句的自然語言特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810193537.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種影視作品的制作方法、裝置及設備
- 下一篇:一種常用數據緩存系統





