[發明專利]問題識別及查詢方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011481964.4 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112559687A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 蔣佳惟;周元笙;馬龍;梁宸;陳思姣;李炫 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F16/335;G06F40/151;G06F40/30 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 問題 識別 查詢 方法 裝置 電子設備 存儲 介質 | ||
1.一種問題識別及查詢方法,其特征在于,所述方法包括:
獲取原始數據,對所述原始數據進行文本轉化,得到原始文本數據;
利用預構建的語義抽取模型對所述原始文本數據進行句式判斷,若所述原始文本數據無缺失信息,則對所述原始文本數據不作處理,若所述原始文本數據有缺失信息,則對所述原始文本數據的缺失信息進行填充,得到標準文本數據;
利用預構建的語義識別模型對所述標準文本數據進行語義識別,得到語義識別結果;
利用所述語義識別結果及預設的查詢模板查詢數據庫內容,得到查詢結果并反饋給查詢終端。
2.如權利要求1所述的問題識別及查詢方法,其特征在于,所述獲取原始數據,對所述原始數據進行文本轉化,得到原始文本數據,包括:
判斷所述原始數據的數據類型;
若所述原始數據的數據類型為文本數據,則對所述原始數據不作處理;
若所述原始數據的數據類型為語音數據,則利用預設的語音接口調用語音轉換工具,并根據所述語音轉換工具將所述語音數據轉換為文本數據;
匯總所有文本數據,得到所述原始文本數據。
3.如權利要求1所述的問題識別及查詢方法,其特征在于,所述利用預構建的語義抽取模型對所述原始文本數據進行句式判斷之前,還包括:
獲取第一訓練集,利用預構建的第一語言模型提取所述第一訓練集中的實體信息;
根據所述實體信息預測與所述實體信息對應的實體和實體關系;
計算所述實體信息預測的準確率,當所述準確率高于預設的閾值時,生成所述語義抽取模型。
4.如權利要求3所述的問題識別及查詢方法,其特征在于,所述計算所述實體信息預測的準確率,包括:
利用下述公式計算準確率L:
其中,er,s為真正有關系的實體,er,c為預測的有關系的實體,R為所有實體個數,r為第r個實體。
5.如權利要求1所述的問題識別及查詢方法,其特征在于,所述利用預構建的語義識別模型對所述標準文本數據進行語義識別之前,還包括:
獲取第二訓練集,利用所述第二訓練集訓練預構建的第二語言模型;
當所述第二語言模型的學習率小于等于預設的閾值時,得到所述語義識別模型。
6.如權利要求1至5中任意一項所述的問題識別及查詢方法,其特征在于,所述利用預構建的語義識別模型對所述標準文本數據進行語義識別,得到語義識別結果,包括:
將所述標準文本數據轉化為原始序列,并利用所述語義識別模型的編碼器對所述原始序列進行編碼,得到編碼序列;
利用預設的二分類器預測所述編碼序列中的實體信息;
從所述編碼序列中抽取出所述實體信息首尾對應的編碼向量;
以所述編碼向量作為條件對所述編碼序列做層標準化,根據所述層標準化后的序列預測與所述實體信息對應的實體和實體關系,匯總所述實體信息、實體及實體關系,得到所述語義識別結果。
7.如權利要求1至5中任意一項所述的問題識別及查詢方法,其特征在于,所述利用所述語義識別結果及預設的查詢模板查詢數據庫內容,得到查詢結果并反饋給查詢終端,包括:
獲取查詢模板;
利用預設的替換腳本將所述語義識別結果作為查詢條件替換所述查詢模板中的固定參數,得到包含查詢條件的查詢語句;
利用所述查詢語句在預設的數據庫中查找數據,并將查找的數據作為查詢結果反饋至查詢終端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011481964.4/1.html,轉載請聲明來源鉆瓜專利網。





