[發明專利]信息獲取方法、裝置、電子設備及計算機可讀存儲介質在審
| 申請號: | 202010121475.1 | 申請日: | 2020-02-26 |
| 公開(公告)號: | CN111368093A | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 梁天新 | 申請(專利權)人: | 京東方科技集團股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/901;G06N5/02 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 李娜 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 獲取 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
本申請提供了一種信息獲取方法、裝置、電子設備及計算機可讀存儲介質。所述方法包括:調用實體識別模型對獲取的待解答問題進行識別處理,得到實體檢索詞;調用問題分類模型對所述待解答問題進行分類處理,確定所述待解答問題對應的目標問題類別;根據問題類別與查詢模板之間的對應關系,獲取所述目標問題類別對應的目標查詢模板;調用所述目標查詢模板根據所述實體檢索詞在預置數據庫中進行信息檢索,獲取所述實體檢索詞對應的檢索信息。本申請能夠提升海量提問的準確率。
技術領域
本申請涉及信息檢索技術領域,特別是涉及一種信息獲取方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
知識圖譜(Knowledge Graph)又稱為科學知識圖譜,在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。通過將應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,并利用可視化的圖譜形象地展示學科的核心結構、發展歷史、前沿領域以及整體知識架構達到多學科融合目的的現代理論。為學科研究提供切實的、有價值的參考。
當前知識圖譜領域的一個重大問題是應用落地,一般分為兩個方面:推薦系統和問答系統,問答系統往往需要大量的人工標注,確定其中包含的實體和意圖,當前模型僅僅依賴字典和單意圖識別的方式是不能夠滿足知識圖譜問答需求的。
發明內容
本申請提供一種信息獲取方法、裝置、電子設備及計算機可讀存儲介質,以解決現有技術中的問答系統需要大量的人工標注,確定其中包含的實體和意圖,當前模型僅僅依賴字典和單意圖識別的方式不能夠滿足知識圖譜問答需求的問題。
為了解決上述問題,本申請公開了一種信息獲取方法,包括:
調用實體識別模型對獲取的待解答問題進行識別處理,得到實體檢索詞;
調用問題分類模型對所述待解答問題進行分類處理,確定所述待解答問題對應的目標問題類別;
根據問題類別與查詢模板之間的對應關系,獲取所述目標問題類別對應的目標查詢模板;
調用所述目標查詢模板根據所述實體檢索詞在預置數據庫中進行信息檢索,獲取所述實體檢索詞對應的檢索信息。
可選地,所述實體識別模型通過以下方式訓練得到:
獲取包含多個問題的問題集合;
對所述問題集合中的多個問題分別進行標注處理,生成標注問題集合;
采用所述標注問題集合對預訓練實體識別模型進行實體抽取和詞性訓練,得到所述實體識別模型。
可選地,在所述根據問題類別與查詢模板之間的對應關系,獲取所述目標問題類別對應的目標查詢模板之前,還包括:
對所述標注問題集合中的多個標注問題進行范化處理,生成范化問題集合;
將所述范化問題集合中的多個范化問題進行分類處理,得到多個所述范化問題的問題類別,生成分類問題集合;
根據所述分類問題集合中的多個所述問題類別,編寫得到多個所述問題類別對應的查詢模板。
可選地,所述將所述范化問題集合中的多個范化問題進行分類處理,得到多個所述范化問題的問題類別,生成分類問題集合,包括:
采用預置分類模型對所述多個范化問題進行分類處理,得到置信度大于設定閾值的一級問題類別;
獲取所述多個范化問題中置信度小于或者等于所述設定閾值的至少一個范化問題;
對所述至少一個范化問題進行二次分類處理,得到至少一個二級問題類別;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司,未經京東方科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010121475.1/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





