[發(fā)明專利]用于自動建立網(wǎng)絡(luò)上信息對象之間層次結(jié)構(gòu)的方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 200710196522.3 | 申請日: | 2007-11-28 |
| 公開(公告)號: | CN101452462A | 公開(公告)日: | 2009-06-10 |
| 發(fā)明(設(shè)計)人: | 李建強;趙彧;趙凱;福島俊一 | 申請(專利權(quán))人: | 日電(中國)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/06 |
| 代理公司: | 北京東方億思知識產(chǎn)權(quán)代理有限責任公司 | 代理人: | 王 怡 |
| 地址: | 100007北京市東城區(qū)東四十*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 自動 建立 網(wǎng)絡(luò) 信息 對象 之間 層次 結(jié)構(gòu) 方法 系統(tǒng) | ||
1.一種用于自動建立網(wǎng)絡(luò)上信息對象之間的層次結(jié)構(gòu)的方法,包括:?
獲取與預定領(lǐng)域相關(guān)的一組URL;?
檢索得到與所述URL組中的各個URL相對應的網(wǎng)站的集合;?
針對所述網(wǎng)站集合中的每個網(wǎng)站提取出一個層次結(jié)構(gòu),所述層次結(jié)構(gòu)上的每個節(jié)點代表所述網(wǎng)站中涉及的所述預定領(lǐng)域的一個信息對象類別;以及?
集成提取出的所有所述層次結(jié)構(gòu)以生成對應于所述預定領(lǐng)域的集成層次結(jié)構(gòu);?
還包括:?
提取出相關(guān)領(lǐng)域中的信息對象類別相對應的實例,從而將不帶有類別信息的對象實例映射到層次結(jié)構(gòu)上的正確位置;以及?
將提取出的實例映射到所述集成層次結(jié)構(gòu)上的節(jié)點;?
其中將所述實例映射到所述集成層次結(jié)構(gòu)上的節(jié)點包括:?
參考本體信息生成分層字典,所述本體信息包括與所述預定領(lǐng)域相關(guān)的各個信息對象類別的代表性描述,所述分層字典在結(jié)構(gòu)上與所述集成層次結(jié)構(gòu)相對應,并且所述分層字典的每個節(jié)點包括與所述集成層次結(jié)構(gòu)上的相應節(jié)點處的信息對象類別相關(guān)聯(lián)的一個或多個所述代表性描述;?
將所述實例與所述分層字典的各個節(jié)點處的所述代表性描述相比較以計算所述實例與所述集成層次結(jié)構(gòu)上的各個節(jié)點之間的相似性度量;以及?
根據(jù)所述確定的相似性度量將所述實例映射到所述集成層次結(jié)構(gòu)上的節(jié)點。?
2.如權(quán)利要求1所述的方法,其中在所述集成步驟中,所述層次結(jié)構(gòu)以兩兩集成方式或多個同時集成方式被集成,?
其中在所述兩兩集成方式中,提取出的針對各個網(wǎng)站的層次結(jié)構(gòu)被兩兩逐個集成,即在將兩個層次結(jié)構(gòu)集成生成一個中間層次結(jié)構(gòu)之后,再將下一層次結(jié)構(gòu)與已經(jīng)生成的所述中間層次結(jié)構(gòu)集成,以此類推以得到最終的所述集成層次結(jié)構(gòu),?
其中在所述多個同時集成方式中,提取出的針對各個網(wǎng)站的所有層次結(jié)構(gòu)被同時集成,以得到最終的所述集成層次結(jié)構(gòu)。?
3.如權(quán)利要求2所述的方法,其中在所述兩兩集成方式中,以如下方式集成第一和第二層次結(jié)構(gòu)以生成中間層次結(jié)構(gòu):?
計算所述第一層次結(jié)構(gòu)上的節(jié)點與所述第二層次結(jié)構(gòu)上的節(jié)點之間的關(guān)系;?
存儲計算出的所有所述關(guān)系;?
根據(jù)存儲的各個所述關(guān)系來確定應該對相應節(jié)點執(zhí)行的操作;以及?
對所述第一和第二層次結(jié)構(gòu)上的所有節(jié)點執(zhí)行確定的所述操作以實現(xiàn)所述第一和第二層次結(jié)構(gòu)的集成。?
4.如權(quán)利要求3所述的方法,其中所述第一層次結(jié)構(gòu)上的第一節(jié)點與所述第二層次結(jié)構(gòu)上的第二節(jié)點之間具有多個關(guān)系,并且所述集成步驟還包括:?
執(zhí)行判決以確定所述第一和第二節(jié)點之間的唯一關(guān)系;并且?
根據(jù)所述確定的唯一關(guān)系來確定應該對所述第一和第二節(jié)點執(zhí)行的操作。?
5.如權(quán)利要求3所述的方法,其中計算所述關(guān)系包括基于所述兩個節(jié)點的文本的計算、基于所述兩個節(jié)點之間的上下文的計算和基于所述兩個節(jié)點的實例的計算。?
6.如權(quán)利要求3所述的方法,還包括對所述第一和第二層次結(jié)構(gòu)上的節(jié)點執(zhí)行預處理,以檢測對應屬性值節(jié)點和組合節(jié)點。?
7.如權(quán)利要求3所述的方法,其中所述計算出的所有所述關(guān)系以表格形式存儲,所述表格中的每一行代表一條記錄,其存儲了所述第一和第二層次結(jié)構(gòu)上的一對節(jié)點之間的關(guān)系。?
8.如權(quán)利要求7所述的方法,其中根據(jù)所述表格中存儲的記錄的可靠程度來逐步集成所述第一和第二層次結(jié)構(gòu)上的各對節(jié)點,即記錄的可靠性越高,相應節(jié)點對被越早集成。?
9.如權(quán)利要求3所述的方法,其中所述關(guān)系包括相同、相似、包括、被包括、交叉和無關(guān)系。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于日電(中國)有限公司,未經(jīng)日電(中國)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710196522.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應系統(tǒng)和方法及應用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復網(wǎng)絡(luò)地址自動恢復的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





