[發(fā)明專利]基于命名實(shí)體庫(kù)的在線知識(shí)地圖有效
| 申請(qǐng)?zhí)枺?/td> | 201410199271.4 | 申請(qǐng)日: | 2014-05-12 |
| 公開(kāi)(公告)號(hào): | CN103955531B | 公開(kāi)(公告)日: | 2017-06-30 |
| 發(fā)明(設(shè)計(jì))人: | 李華康;過(guò)敏意;沈耀 | 申請(qǐng)(專利權(quán))人: | 南京提坦信息科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京聯(lián)瑞聯(lián)豐知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)11411 | 代理人: | 曾少麗 |
| 地址: | 210000 江蘇省南京市南京溧水經(jīng)濟(jì)開(kāi)發(fā)區(qū)柘寧東*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 命名 實(shí)體 在線 知識(shí) 地圖 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種制作知識(shí)地圖的方法,具體涉及一種基于命名實(shí)體庫(kù)的在線知識(shí)地圖。
背景技術(shù)
知識(shí)地圖最早由英國(guó)情報(bào)學(xué)家B·C·布魯克斯在《情報(bào)學(xué)基礎(chǔ)》中提出情報(bào)學(xué)的真正任務(wù)是組織、加工和整理客官知識(shí),繪制以各個(gè)知識(shí)單元為節(jié)點(diǎn)的知識(shí)地圖。隨著知識(shí)管理研究的發(fā)展,知識(shí)地步作為一種組織和管理的重要工具得到了廣泛地研究,被應(yīng)用于知識(shí)審計(jì)、知識(shí)組織、知識(shí)門戶、知識(shí)評(píng)價(jià)、知識(shí)體系等諸多方面。目前國(guó)內(nèi)外在知識(shí)地圖的生成技術(shù)方面主要有以下幾個(gè)方面:
迪吉科技有限公司的賀嘉生在2002提出了一種“知識(shí)地圖的建立、編輯、檢索與對(duì)應(yīng)網(wǎng)絡(luò)上信息內(nèi)容的編輯方法”【CN1448863A】,依據(jù)不同的知識(shí)范疇,建立一套向現(xiàn)有知識(shí)地圖中新增知識(shí)節(jié)點(diǎn)名稱、描述、父節(jié)點(diǎn)、型態(tài)識(shí)別碼的方法,接住輸入節(jié)點(diǎn)識(shí)別碼修改或刪除知識(shí)地圖中的節(jié)點(diǎn)名稱及節(jié)點(diǎn)描述,最終利用知識(shí)地圖進(jìn)行搜尋、分類、編輯、檢索,使所匯集的知識(shí)、信息圖書(shū)館化。
T.H.Ong等人在2005年提出了“Newsmap:一種在線新聞的知識(shí)地圖(Newsmap:A knowledge map for on line news)”(Decision Support System,Vol.39,pp.583-597,Apr.2005),通過(guò)生成層次化知識(shí)地圖的可視化技術(shù)成功的展示了商業(yè)和醫(yī)療的新聞知識(shí)。
Duen-Ren Liu等人在2008年提出一種“復(fù)合電子服務(wù)的知識(shí)地圖:一種基于挖掘與建議耦合的系統(tǒng)平臺(tái)(Knowledge maps for composite e-services:A Mining-based system platform coupling with recommendations)”(Expert System with Application,34,pp.700-716,2008)使用系統(tǒng)記錄中抽取知識(shí)模式,輔以數(shù)據(jù)挖掘技術(shù)構(gòu)建知識(shí)地圖。
上海交通大學(xué)的王英林等人在2011年提出了一種“基于本體的知識(shí)地圖繪制系統(tǒng)”【CN102184194A】包括本體知識(shí)庫(kù)、知識(shí)地圖標(biāo)示層和知識(shí)地圖管理層。該技術(shù)以本體數(shù)據(jù)庫(kù)的圖形結(jié)構(gòu)作為基本數(shù)據(jù)結(jié)構(gòu),通過(guò)對(duì)知識(shí)概念和知識(shí)關(guān)聯(lián)的抽取表達(dá)來(lái)實(shí)現(xiàn)對(duì)不同知識(shí)地圖的創(chuàng)建需求,并以XML形式輸出到知識(shí)地圖顯示系統(tǒng)中。其中本體知識(shí)庫(kù)存儲(chǔ)通用知識(shí)及知識(shí)見(jiàn)的關(guān)系,知識(shí)地圖表示層和本體知識(shí)庫(kù)項(xiàng)鏈,并用抽象的知識(shí)節(jié)點(diǎn)代替知識(shí)庫(kù)中的具體知識(shí)概念,知識(shí)關(guān)聯(lián)引入復(fù)合運(yùn)算,知識(shí)地圖管理層與知識(shí)地圖標(biāo)示層項(xiàng)鏈管理抽象知識(shí)和復(fù)合知識(shí)關(guān)聯(lián)的定義并存儲(chǔ)到獨(dú)立的數(shù)據(jù)庫(kù)中實(shí)現(xiàn)知識(shí)地圖的生成。
華中科技大學(xué)的金海教授等人在2012年提出了“一種基于維基百科構(gòu)建概念型知識(shí)地 圖的方法”【CN102609449A】從維基百科全文數(shù)據(jù)中抽取知識(shí)文檔并分析其知識(shí)信息存入數(shù)據(jù)庫(kù),以知識(shí)節(jié)點(diǎn)格式描述將數(shù)據(jù)庫(kù)中的知識(shí)轉(zhuǎn)化為概念知識(shí)節(jié)點(diǎn)和類別知識(shí)節(jié)點(diǎn),并建立索引提供基于關(guān)鍵字的知識(shí)檢索。
銘傳大學(xué)的盧陽(yáng)正等人在2012年提出的“制作知識(shí)地圖的方法”【CN103106232A】以詞匯為中心,知識(shí)地圖包含詞匯(t)、多個(gè)關(guān)聯(lián)詞匯(s)及相互間權(quán)重(w),通過(guò)建立關(guān)聯(lián)知識(shí)集{(t,s,w)}提供查詢服務(wù)。通過(guò)詞匯關(guān)聯(lián)和知識(shí)集篩選,用K-mouns算法將關(guān)聯(lián)詞匯分組,輸出知識(shí)地圖。
這些知識(shí)地圖的生成技術(shù)需要一個(gè)特定的文檔集或者關(guān)系數(shù)據(jù)庫(kù)中抽取出特定方面的信息,每次構(gòu)建知識(shí)地圖時(shí)需要重新收集和挖掘必要的信息,面對(duì)快速發(fā)展的互聯(lián)網(wǎng)信息很難達(dá)到高效地添加新知識(shí),實(shí)現(xiàn)高效地知識(shí)地圖的更新。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)存在的以上問(wèn)題,提供一種一種基于命名實(shí)體庫(kù)的在線知識(shí)地圖,本發(fā)明從海量新增網(wǎng)頁(yè)文本信息中抽取命名實(shí)體,自動(dòng)地建立實(shí)體節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系,根據(jù)知識(shí)節(jié)點(diǎn)及其之間的關(guān)聯(lián)關(guān)系建立知識(shí)地圖,并能高效地實(shí)現(xiàn)知識(shí)地圖的更新。
為實(shí)現(xiàn)上述技術(shù)目的,達(dá)到上述技術(shù)效果,本發(fā)明通過(guò)以下技術(shù)方案實(shí)現(xiàn):
基于命名實(shí)體庫(kù)的在線知識(shí)地圖的生成方法,包括以下步驟:
步驟1)爬取網(wǎng)頁(yè),向整個(gè)互聯(lián)網(wǎng)爬取網(wǎng)頁(yè)信息,得到互聯(lián)網(wǎng)數(shù)據(jù)集;
步驟2)抽取命名實(shí)體,對(duì)互聯(lián)網(wǎng)數(shù)據(jù)集的內(nèi)容進(jìn)行識(shí)別和抽取,得到命名實(shí)體;
步驟3)尋找屬性詞,遍歷步驟1中的互聯(lián)網(wǎng)數(shù)據(jù)集,尋找命名實(shí)體與屬性對(duì),建立與命名實(shí)體相關(guān)的屬性集合;
步驟4)量化信息,量化屬性集合中屬性詞與命名實(shí)體之間的關(guān)聯(lián)關(guān)系,使命名實(shí)體關(guān)聯(lián)屬性詞集;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京提坦信息科技有限公司,未經(jīng)南京提坦信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410199271.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 具有多位字段的寄存器的重命名
- 命名實(shí)體識(shí)別方法及裝置
- 主命名節(jié)點(diǎn)設(shè)置方法及裝置
- 命名實(shí)體的識(shí)別方法、識(shí)別系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 數(shù)據(jù)處理方法、裝置及計(jì)算機(jī)終端
- 命名實(shí)體消歧方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文件默認(rèn)命名方法、裝置和電子設(shè)備
- 命名實(shí)體識(shí)別方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種集群命名空間管理方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)
- 命名實(shí)體歸一化處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)實(shí)體監(jiān)控方法及裝置
- 一種實(shí)體鏈接方法及裝置
- 一種基于深度學(xué)習(xí)的實(shí)體鏈接方法
- 實(shí)體發(fā)現(xiàn)方法及裝置
- 一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體關(guān)系識(shí)別方法、裝置及設(shè)備
- 尾實(shí)體鏈接方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于實(shí)體對(duì)齊的屬性融合方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體召回方法及相關(guān)裝置
- 實(shí)體表征模型的訓(xùn)練和表征方法、電子設(shè)備和存儲(chǔ)介質(zhì)
- 用于呈現(xiàn)在線實(shí)體在線狀態(tài)的系統(tǒng)和方法
- 提供web服務(wù)接入的在線系統(tǒng)和方法
- 定制在線圖標(biāo)
- 一種水質(zhì)在線檢測(cè)預(yù)處理裝置
- 在線測(cè)試學(xué)習(xí)方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種在線文檔的分頁(yè)方法、裝置、設(shè)備以及可讀介質(zhì)
- 一種基于web在線學(xué)習(xí)的資源訪問(wèn)平臺(tái)
- 一種在線學(xué)習(xí)系統(tǒng)
- 在線文檔提交方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 空調(diào)冷媒量確定方法、系統(tǒng)和可讀存儲(chǔ)介質(zhì)





