[發明專利]一種對電子圖書內容進行語義描述的方法及系統無效
| 申請號: | 201110289163.2 | 申請日: | 2011-09-27 |
| 公開(公告)號: | CN102360351A | 公開(公告)日: | 2012-02-22 |
| 發明(設計)人: | 張訓軍 | 申請(專利權)人: | 北京中科希望軟件股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100190 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電子圖書 內容 進行 語義 描述 方法 系統 | ||
技術領域
本發明涉及電子圖書數字出版技術領域,特別是涉及一種對電子 圖書內容進行語義描述的方法及系統。
背景技術
出版企業目前正在把紙質圖書進行電子格式的加工,形成各類電 子文件。電子文件比較紙質圖書最大的優勢在于內容可以被檢索,極 大地加快了傳統內容檢索的效率,這種技術進步促進了數字出版的誕 生與發展。但是,目前這些格式的電子文件的檢索方式僅僅是全文檢 索與關鍵字檢索,全文檢索暴露的問題是不能精確檢索到讀者真正想 要的內容,最簡單的例子如,檢索“中國”的結果中,一定包括“發 展中國家”這樣的內容。當內容呈現海量時,通過全文檢索的方式就 會檢索到非常多的無效結果,最終使檢索變得低效。而關鍵字的檢索 大多用于文章的檢索,沒有人應用到圖書的各個局部中。
隨著人類社會的發展,人們獲取知識與信息的方式正在發生著變 化,很多人更希望精準地獲取一本圖書中的部分內容,甚至是很少一 部分內容,一本圖書中的大多數內容可能并不是讀者所需要的。這個 市場需求要求圖書的每一個片斷內容是可以被工具按照某種方式被 識別、被檢索的。
本發明就是要通過圖書內容分割與內容語義描述兩種手段相結 合的方式來解決圖書內容的檢索效率的問題。所謂語義描述就是對圖 書中的某一段內容進行一些概括性的解釋,這些解釋的目的就是設法 把讀者的訴求與圖書的內容連接在一起,比如,讀者的訴求往往是“什 么是萬有引力?”、“如何做雞蛋炒西紅柿?”、“地球自轉的原因是 什么?”,如果要讓工具在浩如煙海的圖書中快速而又精準地檢索到 這些內容,那么就要對這些圖書的某段內容進行“萬有引力的定理” “、“做雞蛋炒西紅柿的方法”這樣的概括性的語義描述。
要實現圖書內容的語義描述的目標,就必須解決好兩個問題:
一是要有一個很好的方法來分割圖書內容,使分割的片斷內容可 以任意大小,同時保持一定的層次關系。目前已有的分割方法不能實 現任意大小的分割,不能實現跨章、跨節的片斷的分割,完全是按傳 統排版結構來分割的;
二是建立一種方法來對每一個片斷內容進行多角度的語義描述, 使之與讀者多種訴求相聯系。目前對圖書的語義描述僅僅是關鍵詞, 沒有完整的語義,更沒有與某種市場需求對應起來。
發明內容
鑒于現有技術的缺陷,本發明提供一種對電子圖書內容進行語義 描述的方法,其特征在于包括如下步驟:(1)用XML語言,按照電子 圖書中對結構及語義描述的規則與賦值范圍產生一個包括結構字典 與語義字典的XML?Schema文件;(2)導入電子圖書并按照所述結構 字典把電子圖書內容拆分成多個片斷;(3)為每個片斷賦予用于標出 其在電子圖書中的先后順序及嵌套關系的結構屬性,生成一個具有先 后順序及嵌套關系的XML文件;(4)在所述XML文件中按照所述語義 字典分別對每個片斷進行語義描述賦值,形成一個新的XML文件;(5) 對新的XML文件添加XML?Schema聲明、版權聲明最終形成的電子圖 書文件。
本發明進一步提供一種對電子圖書內容進行語義描述的系統,其 特征在于包括:(1)用于使用XML語言,按照電子圖書中對結構及語 義描述的規則與賦值范圍產生一個包括結構字典與語義字典的XML Schema文件的裝置;(2)用于導入電子圖書并按照所述結構字典把 電子圖書內容拆分成多個片斷的裝置;(3)用于為每個片斷賦予用于 標出其在電子圖書中的先后順序及嵌套關系的結構屬性,生成一個具 有先后順序及嵌套關系的XML文件的裝置;(4)用于在所述XML文件 中按照所述語義字典分別對每個片斷進行語義描述賦值,形成一個新 的XML文件的裝置;(5)對新的XML文件添加XML?Schema聲明、版 權聲明最終形成的電子圖書文件的裝置。
本發明能夠實現電子圖書的片斷內容的語義描述,圖書不再是完 整的一部,而是被有目的地分成若干個片斷,每一個片斷都對應著讀 者的一個或多個訴求,海量的圖書最終形成了海量的知識庫,而不是 簡單的數據庫。讀者的每一個問題都能從知識庫中檢索到一個或多個 答案,這完全高于全文檢索與關鍵字的檢索效率,這在垃圾數據日益 膨脹的未來更加重要與迫切。此外,語義描述后的圖書形成的知識庫, 可以根據語義的組合及機器推理工具產生智能庫,為人工智能的發展 將起到重要作用。本發明專利屬于用于外部數據處理的涉及計算機程 序的發明專利。
附圖說明
圖1是本發明對電子圖書進行語義描述的方法的數據處理流程 圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科希望軟件股份有限公司,未經北京中科希望軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110289163.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:懸掛式可移動火車餐車
- 下一篇:一種具有防撞擊性盜開鎖裝置的鎖芯
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





