[發明專利]基于命名實體庫的在線知識地圖有效
| 申請號: | 201410199271.4 | 申請日: | 2014-05-12 |
| 公開(公告)號: | CN103955531B | 公開(公告)日: | 2017-06-30 |
| 發明(設計)人: | 李華康;過敏意;沈耀 | 申請(專利權)人: | 南京提坦信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京聯瑞聯豐知識產權代理事務所(普通合伙)11411 | 代理人: | 曾少麗 |
| 地址: | 210000 江蘇省南京市南京溧水經濟開發區柘寧東*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 命名 實體 在線 知識 地圖 | ||
1.基于命名實體庫的在線知識地圖的生成方法,其特征在于:包括以下步驟:
步驟1:爬取網頁,向整個互聯網爬取網頁信息,得到互聯網數據集;
步驟2:抽取命名實體,對互聯網數據集的內容進行識別和抽取,得到命名實體;
步驟3:尋找并建立集合,遍歷步驟1中的互聯網數據集,尋找命名實體與屬性對,建立與命名實體相關的屬性集合;
步驟4:量化信息,量化屬性集合中屬性詞與命名實體之間的關聯關系,使命名實體關聯屬性詞集;
步驟5:建立知識地圖,通過命名實體關聯的屬性詞集之間的關系,建立命名實體與命名實體之間的拓撲結構,形成知識地圖;
步驟6:更新,在設定周期內對拓撲結構進行更新;
所述步驟6包括以下過程:
(b1)重新爬取網頁,向整個互聯網爬取網頁信息,得到最新的互聯網數據集;
(b2)抽取命名實體,對最新的互聯網數據集的內容進行識別并抽取,得到命名實體;
(b3)尋找屬性詞,遍歷最新的互聯網數據集,尋找命名實體與屬性對,建立新的命名實體與屬性集合;
(b4)對步驟5中的拓撲結構進行更新,將新的命名實體與屬性集合和步驟3中命名實體與屬性集合進行對比,首先對比命名實體,一致則對比屬性集合,不一致則將新的命名實體加入知識地圖中并存儲至本地,屬性集合對比一致則繼續對比,不一致則將新的屬性集合加入知識地圖中關聯與之相對應的命名實體并保存至本地;
(b5)量化信息,量化更新后的屬性集合中屬性詞與命名實體之間的關聯關系,使命名實體關聯屬性詞集,完成更新。
2.根據權利要求1所述的基于命名實體庫的在線知識地圖的生成方法,特征在于:所述互聯網數據集的內容包括結構化信息、半結構化與非結構化信息。
3.根據權利要求1所述的基于命名實體庫的在線知識地圖的生成方法,其特征在于:遍歷所述步驟2中命名實體的判別是將互聯網數據集的文檔中的關鍵詞所屬結構作為分類標簽進行多維度識別。
4.根據權利要求1所述的基于命名實體庫的在線知識地圖的生成方法,特征在于:所述步驟3包括以下過程:
(a1)遍歷互聯網數據集,以命名實體為中心,尋找出與命名實體相關聯的屬性詞;
(a2)建立屬性詞與命名實體間的關聯關系,形成一個命名實體對應一個屬性集合。
5.根據權利要求1所述的基于命名實體庫的在線知識地圖的生成方法,其特征在于:所述步驟4的量化信息具體為將不同命名實體對應的不同屬性集合之間相同的部分進行整合并關聯,建立不同屬性集合之間的關聯關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京提坦信息科技有限公司,未經南京提坦信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410199271.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種挖孔樁護壁加固結構
- 下一篇:一種堆載式現場變形模量試驗儀





