[發明專利]一種面向5W問答的基于數據圖譜、信息圖譜、知識圖譜和智慧圖譜的推薦引擎設計方法在審
| 申請號: | 201710363378.1 | 申請日: | 2017-05-22 |
| 公開(公告)號: | CN107977393A | 公開(公告)日: | 2018-05-01 |
| 發明(設計)人: | 段玉聰;邵禮旭 | 申請(專利權)人: | 海南大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N99/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 570228 海*** | 國省代碼: | 海南;46 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 問答 基于 數據 圖譜 信息 知識 智慧 推薦 引擎 設計 方法 | ||
技術領域
本發明是一種面向5W問答的基于數據圖譜、信息圖譜、知識圖譜和智慧圖譜的推薦引擎設計方法。主要用于通過查詢圖譜回答用戶使用自然語言提出的問題,屬于分布式計算和軟件工程學技術交叉領域。
背景技術
知識圖譜于2012年5月17日被Google正式提出,其初衷是為了提高搜索引擎的能力,增強用戶的搜索質量以及搜索體驗。目前,隨著智能信息服務應用的不斷發展,知識圖譜已被廣泛應用于智能搜索、智能問答、個性化推薦等領域。尤其是在智能搜索中,用戶的搜索請求不再局限于簡單的關鍵詞匹配,用戶的信息需求僅僅通過關鍵字是不能被完整表達的。自然語言問題是制定信息需求最直觀的方式,人們可以通過提出問題來表達他們的信息需求。問題可用于表達不能表達為關鍵字的復雜信息需求,并且不會在結構和語義上產生重大損失。知識圖譜具有豐富的自然語義,可以包含各種更完整的信息,其表達機制更接近于自然語言,能以圖形化的方式向用戶展示經過分類整理的結構化知識,從而使用戶從人工過濾網頁尋找答案的模式中解脫出來。我們提出在數據、信息、知識和智慧層面上澄清知識圖譜的整體表達,分別使用數據圖譜、信息圖譜、知識圖譜和智慧圖譜來解決5W問題。
在本發明做出之前,已有的智能語義搜索應用中,當用戶發起查詢時,搜索引擎會借助知識圖譜的幫助對用戶查詢的關鍵字進行解析和推理,進而將其映射到知識圖譜中的一個或一組概念之上,然后根據知識圖譜中的概念層次結構,向用戶返回知識卡片,其中包括指向資源頁面的超鏈接信息。在深度問答應用中,系統同樣會首先在知識圖譜的幫助下對用戶使用自然語言提出的問題進行語義分析和語法分析,進而將其轉化成結構化形式的查詢語句,然后在知識圖譜中查詢答案。我們將用戶提出的問題根據疑問詞的不同進行分類,由“誰(who)、什么時候(when)、什么地點(where)”等疑問詞引導的問題將在數據圖譜上進行遍歷查找答案,由“什么(what)”引導的問題在信息圖譜上查找答案,由“如何(how)”引導的問題在知識圖譜上查找答案,由“為什么(why)”引導的問題在智慧圖譜上查找答案。
發明內容
技術問題:本發明的目的是提供一種面向5W問答的基于數據圖譜、信息圖譜、知識圖譜和智慧圖譜的推薦引擎設計方法,用于解決當前用戶信息需求變得復雜,僅僅通過關鍵詞查詢效率低下的問題,對由5W引導的問題我們限定是最基本的問題類型,不涉及5W問題之間的轉換。本發明可顯著地提高用戶查詢的查全率和查準率。
技術方案:一種面向5W問答的基于數據圖譜、信息圖譜、知識圖譜和智慧圖譜的推薦引擎設計方法,其步驟如下所示。
1.構建問題模式庫。將用戶用自然語言提出的問題根據疑問詞的不同劃分為:a)由誰(who)或什么時候(when)或什么地點(where)引導的問題;b)由什么(what)引導的問題;c)由如何(how)引導的問題;d)由為什么(why)引導的問題。
2. 對用戶提出的問題進行分詞,從而確定問題類型。
3. 根據問題的類型,選擇在哪種圖譜上進行遍歷查找答案。
(1)基于數據圖譜回答由誰(who)或什么時候(when)或什么地點(where)引導的問題。利用對齊規則將用戶提出的問題中的(疑問詞,關系詞,實體)映射到數據圖譜中相關的(主體,關系詞,客體),形成精確的查詢語句,利用該查詢語句得到答案。
(2)基于信息圖譜回答由什么(what)引導的問題:
a)通過大量數據集訓練,得出劃分實體類型的規則;將用戶問題中的實體屬性與信息圖譜中實體屬性相匹配,計算相似度,將相似度最高的實體作為答案返回給用戶;
b)在信息圖譜上若無法直接找到答案,可以通過信息推理建立兩個實體間的關系,增加圖譜邊密度,新建立的關系的正確度Cr是可計算的,P表示實體1和實體2之間的一條路徑,Q表示所有路徑,表示訓練權重:
;
c)信息圖譜還能根據用戶的問題進行相應的語義擴展,以返回更多用戶關心的信息,進一步提高查全率和查準率。
(3)基于知識圖譜回答由如何(how)引導的問題:
由如何(how)引導的問題,答案通常是以類似流程圖的形式給出,因此我們在知識圖譜上找到問題中的相關實體后,通過路徑查詢,將相鄰的實體和關系詞進行橋接。
(4)基于智慧圖譜回答由為什么(why)引導的問題:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于海南大學,未經海南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710363378.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:信息處理裝置
- 下一篇:用于安全的盤訪問控制的方法和系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





