[發(fā)明專利]自然語言語句解析方法、裝置、電子設備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011523884.0 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112632100A | 公開(公告)日: | 2021-04-09 |
| 發(fā)明(設計)人: | 馬建強;閆澤禹;張揚 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06F8/41 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 熊永強 |
| 地址: | 518000 廣東省深圳市福田區(qū)益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自然語言 語句 解析 方法 裝置 電子設備 存儲 介質(zhì) | ||
1.一種自然語言語句解析方法,其特征在于,所述方法包括:
獲取待解析的自然語言語句;對所述自然語言語句進行槽位解析,得到所述自然語言語句的槽位提及以及槽位關系,所述槽位提及為所述自然語言語句進行槽位解析后各個槽位表示的結構化查詢語言SQL元素,所述槽位關系為槽位提及之間的關系;
根據(jù)所述槽位提及和所述槽位關系確定至少一個待鏈接元素,所述待鏈接元素為用于生成SQL語句的SQL元素;
將所述至少一個待鏈接元素進行鏈接,得到目標SQL語句。
2.根據(jù)權利要求1所述的方法,其特征在于,所述對所述自然語言語句進行槽位解析,得到所述自然語言語句的槽位提及以及槽位關系,包括:
對所述自然語言語句進行標注,得到多個標簽,每一標簽包括功能標簽和位置標簽;
根據(jù)多個標簽中每一標簽的功能標簽和位置標簽將多個標簽組合成標簽序列;
將所述標簽序列中的多個標簽轉換為槽位提及以及槽位關系。
3.根據(jù)權利要求2所述的方法,其特征在于,所述方法應用于抽取鏈接模型,所述抽取鏈接模型包括抽取器和鏈接器,所述抽取器包括預設的語言模型、注意力層和條件隨機場CRF層,所述對所述自然語言語句進行標注,得到多個標簽,包括:
將所述自然語言語句和預設的SQL數(shù)據(jù)庫中的至少一個表頭輸入所述語言模型;
通過所述語言模型對所述自然語言語句和表頭進行編碼,得到所述自然語言語句中各個單詞的模型表征向量和表頭中各個單詞的模型表征向量;
語言模型將所述自然語言語句中各個單詞的模型表征向量和表頭中各個單詞的模型表征向量輸入所述注意力層,所述自然語言語句中的單詞包括符號,所述表頭中的單詞包括列名;
通過所述注意力層對所述自然語言語句中符號的模型表征向量和所述表頭中的列名進行注意力編碼,得到注意力編碼后符號的表征向量和列名的表征向量;
將所述注意力編碼后符號的表征向量和列名的表征向量逐個添加至對應的模型表征向量中,得到增強表征向量;
將所述增強表征向量輸入所述CRF層,所述CRF層將所述增強表征向量進行解碼,得到多個標簽。
4.根據(jù)權利要求2所述的方法,其特征在于,所述多個標簽包括用于表示槽位提及的角色標簽和用于表示槽位關系的跨度標簽,所述根據(jù)多個標簽中每一標簽的功能標簽和位置標簽將多個標簽組合成標簽序列,包括:
查找所述多個標簽中具有相同的功能標簽的角色標簽和跨度標簽;
根據(jù)所述位置標簽將所述具有相同的功能標簽的角色標簽和跨度標簽組成標簽序列。
5.根據(jù)權利要求2所述的方法,其特征在于,所述將所述標簽序列中的多個標簽轉換為槽位提及以及槽位關系,包括:
將所述標簽序列中的角色標簽轉換為符號,作為槽位提及進行輸出;
將所述標簽序列中的跨度標簽轉換為選擇跨度和過濾器跨度,并用與所述選擇跨度和過濾器跨度分別對應的標識方式進行表示。
6.根據(jù)權利要求1-5任一項所述的方法,其特征在于,所述槽位提及包括列提及和值提及,所述根據(jù)所述槽位提及和所述槽位關系確定至少一個待鏈接SQL元素,包括:
根據(jù)所述槽位提及和所述槽位關系將所述列提及和所述值提及映射到預設的SQL數(shù)據(jù)庫中的至少一個目標表頭,所述預設的SQL數(shù)據(jù)庫中包括多個表頭,所述多個表頭包括所述至少一個目標表頭;
將所述至少一個目標表頭中每一目標表頭確定為待鏈接元素,得到至少一個待鏈接元素。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經(jīng)中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011523884.0/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





