[發明專利]一種知識地圖生成方法及裝置在審
| 申請號: | 201510771801.2 | 申請日: | 2015-11-12 |
| 公開(公告)號: | CN105447104A | 公開(公告)日: | 2016-03-30 |
| 發明(設計)人: | 王全禮;邵小亮;謝隆飛;鄭堅鋼;陳飛;楊雷 | 申請(專利權)人: | 中國建設銀行股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 李金;王寶筠 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識 地圖 生成 方法 裝置 | ||
技術領域
本發明屬于知識地圖技術領域,更具體的說,尤其涉及一種知識地圖生成方法及裝置。
背景技術
知識地圖是知識庫系統核心功能模塊之一,其能夠從多條知識組成的知識集合中抽取出來代表所述知識集合核心內容的詞匯,并組裝成網絡結構將各條知識展示出來,因此通過知識地圖可以迅速了解知識集合的核心內容以及多條知識之間的關系。
為了能夠生成知識地圖,其首要任務則是從知識集合中抽取到核心內容,并確定多條知識之間的關系,在申請號為201210383029.3的制作知識地圖的方法中,該知識地圖包含詞匯(t)以及多個關聯詞匯,其技術方案為:建立詞匯關聯知識集{(t,si,wi)|i=1,…,n},其中si代表與該詞匯配對的關聯詞匯,wi代表(t,si)的權重;提供使用者接口,以供查詢該詞匯;從該詞匯關聯知識集篩選出多個關聯詞匯共現配對;將該等關聯詞匯共現配對依K-means演算法分成多個群組;輸出該知識地圖,該知識地圖以該詞匯為中心,該等關聯詞匯以該等群組呈現。
從申請號為201210383029.3的制作知識地圖的方法提供的技術方案可知:其在確定多條知識之間的關系是基于任意兩個詞匯組合的共現度來判斷。但是計算任意兩個詞匯的共現度會造成大量的循環計算操作,使得計算復雜度提高,并且任意兩個詞匯可能包含有無意義詞以及不符合語法要求的詞匯,從而導致共現度計算不準確,導致得到的各條知識之間的關系不準確,進而使得知識地圖的準確度降低。
發明內容
有鑒于此,本發明提供一種知識地圖生成方法及裝置,用于提高知識地圖的準確度,并降低計算復雜度。技術方案如下:
本發明提供一種知識地圖生成方法,所述方法包括:
獲取同一類別中每條熱門知識的關鍵詞,其中所述類別是通過對知識列表進行聚類劃分后得到,且所述知識列表中存儲有所述熱門知識;
計算每個所述關鍵詞的關聯關系,其中所述關聯關系用于指示所述關鍵詞與處于同一類別的關鍵詞之間具有特定關系,以指示不同熱門知識之間具有特定關系;
基于每個所述關鍵詞的關聯關系,獲取作為所述知識地圖的中心節點的關鍵詞;
基于每個所述關鍵詞的關聯關系,獲取所述知識地圖中各個節點的層級關系;
以所述中心節點為基準,依據所述知識地圖中各個節點的層級關系生成所述知識地圖。
優選地,所述計算每個所述關鍵詞的關聯關系,包括:
獲取同一條熱門知識的同一句話中的至少兩個關鍵詞;
如果所述同一條熱門知識的同一句話中至少兩個關鍵詞相連,且在預設關鍵詞集合中查找到相連的至少兩個關鍵詞,則所述相連的至少兩個關鍵詞具有強關聯關系;
如果具有強關聯關系的兩個關鍵詞中的第一關鍵詞與其他具有強關聯關系的兩個關鍵詞中的第二關鍵詞相同,則具有強關聯關系的兩個關鍵詞和其他具有強關聯關系的兩個關鍵詞中的三個關鍵詞具有推導關聯關系;
如果所述同一條熱門知識的同一句話中的至少兩個關鍵詞不相連,則不相連的至少兩個關鍵詞具有弱關聯關系;
將每條熱門知識的關鍵詞按照預設詞組長度進行分詞,若分詞后得到的關鍵詞和分詞前的關鍵詞均在所述預設關鍵詞集合中查找到,則分詞后得到的關鍵詞和分詞前的關鍵詞具有包含關聯關系。
優選地,所述基于每個所述關鍵詞的關聯關系,獲取作為所述知識地圖的中心節點的關鍵詞,包括:
基于每個所述關鍵詞的關聯關系和預設關系權重,計算每個所述關鍵詞的關聯得分;
基于每個所述關鍵詞的關聯得分,從所有關鍵詞中選取關聯得分最高的關鍵詞;
當所述關聯得分最高的關鍵詞的關聯得分大于預設關聯得分時,所述關聯得分最高的關鍵詞為所述知識地圖的中心節點的關鍵詞;
當所述關聯得分最高的關鍵詞的關聯得分小于等于所述預設關聯得分時,選取點擊率最高的關鍵詞為所述知識地圖的中心節點的關鍵詞。
優選地,基于每個所述關鍵詞的關聯關系,獲取所述知識地圖中各個節點的層級關系,包括:
當所述作為知識地圖的中心節點的關鍵詞的關聯關系指示與相連的至少一個關鍵詞具有強關聯關系,則將所述作為知識地圖的中心節點的關鍵詞的強關聯關系作為所述知識地圖中至少一條知識路徑中其他節點與所述中心節點的層級關系,其中所述知識路徑的層級關系為所述作為知識地圖的中心節點的關鍵詞與相連的一個關鍵詞之間的強關聯關系,且每條所述知識路徑基于的強關聯關系不同;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司,未經中國建設銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510771801.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:網絡資源關聯性確定方法和裝置
- 下一篇:一種自動化數據挖掘預處理方法





