[發明專利]一種用學術術語導航網絡學術資源的方法無效
| 申請號: | 200810306041.8 | 申請日: | 2008-12-08 |
| 公開(公告)號: | CN101561811A | 公開(公告)日: | 2009-10-21 |
| 發明(設計)人: | 劉玉良;李連栓 | 申請(專利權)人: | 北京中加國道科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100190北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 學術 術語 導航 網絡 資源 方法 | ||
技術領域
本發明是一種用學術術語導航網絡學術資源的方法,屬于信息存儲與檢索技術領域,可 應用到互聯網上學術性資源的揭示、永久存檔及使用。在學科上屬于現代圖書館學、情報學 范疇。
背景技術
網絡學術資源是互聯網上的和學術有關的數字化資源。網絡學術資源數量巨大,種類繁 多,學科覆蓋面廣,并且具有一定的學術價值,是傳統學術資源,例如學術期刊的重要補充 。
但和學術期刊等傳統的學術資源不同,互聯網學術資源缺乏統一的著錄規范,內容揭示 字段乏善可陳,很少有關鍵詞、主題詞、學科分類碼等信息。這樣一來,互聯網學術資源的 充分利用就非常困難。
學術術語是比關鍵詞、主題詞粒度更細的資源揭示單元,可作為定位網絡學術資源的重 要線索。另一方面,其本身就凝聚了大量的信息,對學術資源的用戶具有重大價值。本發明 以最大化的挖掘網絡學術資源的學術價值為指導原則,以人機結合的方式精選出學術術語, 規范化網絡學術資源的內容描述,并對學術術語按專題進行組織,極大的方便了用戶的使用 。
學術術語的提取、形成、規范是一項極為復雜的知識工程。本發明的實現充分利用日益 普及的計算資源,利用統計機器學習相關的算法,先從網絡學術資源中粗選學術術語,然后 通過領域專家進行精細化加工,并把加工的成果指導粗選過程,提高機器提取學術術語的準 確率。這樣的人機結合不斷重復,直到學術術語的質量和數量達到預期的要求。
發明內容
本發明揭示了一種用學術術語導航網絡學術資源的方法,屬于信息存儲與檢索技術領域 。本方法具體內容如下:
(1)從網絡學術資源提取學術術語
首先檢查網絡學術資源是否有標題、關鍵詞、主題詞,如果有,則從標題、關鍵詞、主 題詞中提取。接下來,將網絡學術資源轉化為文本,以出現頻度高和非常用詞為標準抽取 100個關鍵詞作為候選的學術術語。這些步驟由機器自動完成。
然后,領域專家對候選的學術術語進行甄別、規范,形成高質量的學術術語詞典。每個 學術術語是一個三元組:<中文顯示名;英文顯示名;檢索關鍵詞列表>。其中,中、英文顯 示名是學術術語的通用、規范化描述;檢索關鍵詞列表則是該術語的各種變形表示。
最后,對每個網絡學術資源的每個候選學術術語,檢查是否出現在學術術語詞典中的學 術術語的檢索關鍵詞列表中,如果是,則在該學術資源和該學術術語間建立關聯。這一步由 機器自動完成。
(2)以學術專題形式組織學術術語
一個學術專題(或子專題)表示一個特定的研究領域。學術專題是學術術語的一種聚類 組織形式。每個學術專題(或子專題)包括一個或多個學術術語,而一個學術術語也可隸屬 一個或多個學術專題。
我們先根據當前研究熱點,確定學術專題;然后通過學科專家為每個學術專題遴選學術 術語。同一專題下的學術術語,按照實際使用頻度從高到低排列、優化。這里實際使用頻度 表示用戶使用該學術術語導航的次數,是一種用戶貢獻的數據,隨著學術術語導航系統的使 用而不斷更新。
(3)將學術術語和檢索系統關聯
在(1)中,已經建立了學術術語的對應的關鍵詞(以下簡稱為學術關鍵詞)和網絡學 術資源間的聯系。這一步,檢索系統以網絡學術資源包含的學術關鍵詞為依據對網絡學術資 源進行索引。當用戶點擊學術導航頁面內某個學術術語的中文顯示名或(/和)英文顯示名 時,將把該學術術語對應的學術關鍵詞發送到檢索系統,檢索系統則返回包含任何一個學術 關鍵詞的網絡學術資源。
本方案的優點
本發明揭示了一種用學術術語導航網絡學術資源的方法,能幫助用戶快速的瀏覽到所需 的網絡學術資源:
1、以學術術語作為揭示網絡學術資源的內容手段,符合用戶定位瀏覽網絡學術資源的 需要;
2、每個網絡學術資源用一組學術術語表示;一個學術術語可和多個網絡學術資源發生 聯系;
3、學術術語按學術專題組織:一個學術專題(或子專題)包含若干個學術術語;一個 學術術語也可屬于多個學術專題;
4、每個學術術語表示為一個三元組:<中文顯示名;英文顯示名;檢索關鍵詞列表>。 其中,中、英文顯示名是學術術語的通用、規范化描述;檢索關鍵詞列表則是該術語的各種 變形表示;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中加國道科技有限公司,未經北京中加國道科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810306041.8/2.html,轉載請聲明來源鉆瓜專利網。





