[發明專利]信息獲取方法、裝置、電子設備及計算機可讀存儲介質在審
| 申請號: | 202010121790.4 | 申請日: | 2020-02-26 |
| 公開(公告)號: | CN111368049A | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 楊卓士;王炳乾 | 申請(專利權)人: | 京東方科技集團股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/36;G06F40/295 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 李娜 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 獲取 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
本申請提供了一種信息獲取方法、裝置、電子設備及計算機可讀存儲介質。所述方法包括:獲取搜索語句;通過預先訓練得到的聯合模型對所述搜索語句進行處理,確定所述搜索語句對應的目標搜索意圖、目標實體詞及所述目標實體詞對應的目標實體類型;根據搜索意圖與查詢語句模板之間的對應關系,獲取所述目標搜索意圖對應的目標查詢模板;調用所述目標查詢模板對所述目標實體詞進行語句轉換處理,生成所述目標實體詞對應的目標查詢語句;根據所述目標查詢語句和所述目標實體類型在預置數據庫中進行信息檢索,得到所述搜索語句對應的檢索信息。本申請可以實現實體識別和意圖理解的聯合識別,能夠提高線上系統的性能,提高了問答系統的性能。
技術領域
本申請涉及信息處理技術領域,特別是涉及一種信息獲取方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
問答系統(Question Answering System,QA)是信息檢索系統的一種高級形式,它能用準確、簡潔的自然語言回答用戶用自然語言提出的問題。其研究興起的主要原因是人們對快速、準確地獲取信息的需求。問答系統是目前人工智能和自然語言處理領域中一個倍受關注并具有廣泛發展前景的研究方向。
實體識別和意圖理解是問答系統中的兩個重要環節,現有的問答系統大多將這兩個環節當成兩個子任務來處理,即先識別用戶傳入問題中存在的實體,然后理解問句想要表達的意圖,根據實體和意圖返回對應的答案。實體識別常采用戶字典分詞(實體詞庫)或者基于有監督的大規模語料標注的深度學習方法進行序列標注等方法,問題理解則采用問題對相似度匹配等。這種兩步式的處理方式會在很大程度上影響線上系統的性能。
發明內容
本申請提供一種信息獲取方法、裝置、電子設備及計算機可讀存儲介質,以解決現有技術中實體識別和意圖理解分開執行的方式,很大程度上影響線上系統的性能的問題。
為了解決上述問題,本申請公開了一種信息獲取方法,包括:
獲取搜索語句;
通過預先訓練得到的聯合模型對所述搜索語句進行處理,確定所述搜索語句對應的目標搜索意圖、目標實體詞及所述目標實體詞對應的目標實體類型;
根據搜索意圖與查詢語句模板之間的對應關系,獲取所述目標搜索意圖對應的目標查詢模板;
調用所述目標查詢模板對所述目標實體詞進行語句轉換處理,生成所述目標實體詞對應的目標查詢語句;
根據所述目標查詢語句和所述目標實體類型在預置數據庫中進行信息檢索,得到所述搜索語句對應的檢索信息。
可選地,在所述通過預先訓練得到的聯合模型對所述搜索語句進行處理,確定所述搜索語句對應的目標搜索意圖、目標實體詞及所述目標實體詞對應的目標實體類型之前,還包括:
獲取至少一個查詢類型對應的多個訓練樣本;所述多個訓練樣本包括不同查詢類型的搜索語句,每個所述訓練樣本包含初始搜索意圖和初始實體詞;
針對各所述查詢類型,對所述查詢類型對應的多個訓練樣本進行標注處理,得到標注訓練樣本;
將各所述標注訓練樣本輸入至初始聯合模型;所述初始聯合模型包括意圖理解層和實體識別層;
調用所述意圖理解層對所述標注訓練樣本進行意圖識別處理,確定所述標注訓練樣本對應的預測搜索意圖;
調用所述實體識別層對所述標注訓練樣本進行實體識別處理,確定所述標注訓練樣本對應的預測實體詞;
根據所述預測搜索意圖和所述初始搜索意圖,計算得到所述意圖理解層對應的意圖損失值;
根據所述初始實體詞和所述預測實體詞,計算得到所述實體識別層對應的實體損失值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司,未經京東方科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010121790.4/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





