[發明專利]用于自動建立網絡上信息對象之間層次結構的方法和系統有效
| 申請號: | 200710196522.3 | 申請日: | 2007-11-28 |
| 公開(公告)號: | CN101452462A | 公開(公告)日: | 2009-06-10 |
| 發明(設計)人: | 李建強;趙彧;趙凱;福島俊一 | 申請(專利權)人: | 日電(中國)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/06 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 | 代理人: | 王 怡 |
| 地址: | 100007北京市東城區東四十*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 自動 建立 網絡 信息 對象 之間 層次 結構 方法 系統 | ||
技術領域
本發明涉及信息層次結構(hierarchy)的自動建立以及Web上的領域 (domain)知識收集以及層次結構建立/生成,更具體而言,本發明涉及用 于自動建立網絡上針對特定領域中的信息對象之間的層次結構的方法和系 統。
背景技術
計算機已經成為現代生活必不可少的工具,它可以幫助用戶找到感興 趣的信息,這在當今大量信息在Web上不斷積累的因特網時代尤其明顯。 雖然計算機在進行諸如計算、存儲或搜索之類的信息處理時速度很快,但 其無法理解信息,這成為智能信息處理的主要障礙。為了解決這個問題, 最近用于智能信息處理的語義相關研究變得非常流行。例如,在T. Berners-Lee、J.Hendler和O.Lassila的題為“The?Semantic?Web” (Scientific?American,2001年5月,第28-37頁)、Nigel?Shabolt、Tim Berners-Lee和Wendy?Hall的題為“The?Semantic?Web?Revisited”(IEEE Intelligent?Systems?21(3),第96-101頁,2006年5月、6月)以及E. Hyvonen(編者)的題為“Semantic?Web?Kick-Off?in?Finland-Vision, Technologies,Research,and?Applications”(HIIT?Publications,2002-001, Helsinki?Institute?for?Information?Technology(HIIT),Helsinki,Finland,第304 頁)中所描述的技術,這些文檔通過引用被整體上結合于此以用于所有目 的。它們的主要用途是幫助計算機理解信息的格式和技術。基于某些算術 邏輯,例如描述邏輯和框架邏輯,根據人工智能(AI)傳統規律的知識表 示以及現在流行的Web信息處理技術,諸如萬維網聯盟(W3C)之類的 標準制訂組織正在積極制訂XML(可擴展標記語言)、RDF(資源描述 框架)和OWL(Web本體語言)等標準并且正在推廣語義技術采用的規 則語言,例如Web規則語言和規則標記語言。而且,很多研發商、企業和 相關從業者也已經開始建立和采用相關工具集、產品,甚至實際應用來使 得基于語義的智能信息利用成為可能。
但是,為了使用計算機的強大計算能力和語義相關標準向Web用戶提 供不同的智能信息利用服務,領域知識在其中扮演非常關鍵的角色。因 此,領域知識的建立成為一個急需解決的重要問題。
當前,主要存在兩種領域信息,即本體(ontology)和層次結構。
本體是一種文檔或文件,其對特定領域中的知識進行抽象,以描述其 中的概念和概念之間的關系。用于Web的最典型本體具有分類系統 (taxonomy)和一組推理規則(inference?rule)。其中分類系統定義了對 象類以及它們之間的關系。
層次結構包含節點和連接節點的邊,有時在節點處附接有實例 (instance)。與本體相比,層次結構是一種更簡單的形式。本體中的很多 元素(例如類、屬性、定義和關系)在層次機構中可被忽略。但是,這些 元素也可以通過某些方式從層次結構中推導出來。因此,層次結構可被視 為一種偽本體,其具有明確但不正式的規范。
在現有技術中的本體建立(OB)方法主要分為兩類。即基于原始素材 (raw?material)的本體建立和基于某些已有本體的本體建立。在基于原始 素材的本體建立方法中,例如可以根據詞的共同發生關系(co-occurrence)、 語言學規律、字典等來建立本體。在基于某些已有本體的本體建立方法 中,通過對比概念的文本、上下文等,將若干已有本體集成在一起以得到 一種最終本體。
雖然本體對于語義Web和相關服務是非常重要的,但是要想自動建立 正式本體會遇到很多困難,這是因為本體通常包含很多內容,例如類、類 定義、類關系、屬性等等,而即使通過人為干預,也難以填滿所有這些內 容。因此,顯而易見,本體的復雜格式阻礙了其在Web服務,特別是某些 實時服務中的大規模應用。此外,本體集成通常是通過人為交互來進行 的,它不像層次結構的集成那樣易于自動實現。鑒于此,本發明將主要針 對特定領域中對象(產品)之間的層次結構的建立方法進行描述。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于日電(中國)有限公司,未經日電(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710196522.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種纏繞管生產裝置
- 下一篇:一種甲基氯硅烷合成過程中觸體的處理方法





