日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種對電子圖書進行快速語義標注的方法和系統無效

專利信息
申請號: 201110289165.1 申請日: 2011-09-27
公開(公告)號: CN102332023A 公開(公告)日: 2012-01-25
發明(設計)人: 張訓軍 申請(專利權)人: 北京中科希望軟件股份有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 暫無信息 代理人: 暫無信息
地址: 100190 北京市海*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 電子圖書 進行 快速 語義 標注 方法 系統
【說明書】:

技術領域

發明涉及電子圖書數字出版技術領域,特別是涉及一種對電子圖書進行快速語義標注的方法和系統。

背景技術

數字出版的核心競爭力是對數字內容的快速檢索與方便查閱,而快速檢索與方便查閱的核心是語義檢索,因此,基于語義檢索的語義標注技術是數字出版的核心技術。實現語義標注的技術不同,造成的語義標注的加工效率與成本也不同。目前已有的技術對語義標注的加工效率很低,成本很高。

要解決好效率與成本的問題,就要在技術上解決,技術手段主要與兩個技術問題有關,一個是電子書的拆分結構如何設計,各種排版軟件編排的圖書(或期刊)具有不同的版式特點,數字加工需要把這些圖書拆分為不同粒度的單元,目前所有的拆分方法都面臨著低效率的問題,需要過多的人工干預。另一個就是語義標注如何設計。不同的設計方案產生不同的應用效果與加工成本。

最嚴格的技術方案是可以對電子圖書的每一個細節(比如,像詞這樣的細節)進行語義的標注,這種技術方案的特點是應用范圍廣,缺點是加工成本不容易降得很低。但是實際情況是,有一部分應用并不需要對詞、段這種細節進行語義標注,可能對節以上單元進行標注就可以滿足市場需要了。

本發明方案就是針對這類應用而設計的,可以進一步提高加工效率,降低成本。

發明內容

鑒于現有技術的缺陷,本發明提供一種對電子圖書進行快速語義標注的方法,其特征在于包括如下步驟:(1)以獨立于電子圖書的方式建立用于描述電子圖書的結構的目錄結構文件,把電子圖書的章節目錄提取出來,并建立樹狀結構層次關系,同時每個章節元素含有頁碼信息的屬性;(2)在目錄結構文件的基礎上對目錄元素進行語義標注;(3)對電子圖書按頁進行分割成多個頁文件,每個頁文件是電子圖書的一頁內容;(4)將所述目錄結構文件與圖書CIP數據、版權聲明以及所述多個頁文件一起打包,形成一個完整的電子圖書。

根據本發明所述的對電子圖書進行快速語義標注的方法,其特征在于所述目錄結構文件以XML形式存在,其內容形式采用電子圖書的傳統目錄形式,并可以被第三方工具識別出。

根據本發明所述的對電子圖書進行快速語義標注的方法,其特征在于每一個XML目錄元素具有結構屬性,分別為標題內容與頁碼范圍。

根據本發明所述的對電子圖書進行快速語義標注的方法,其特征在于所述目錄結構文件的生成包括如下步驟:(11)制訂電子書稿在排版過程中對段落樣式的命名的規范;(12)根據段落樣式命名規范,把電子圖書中標題部分提取出來,形成一個沒有層次關系的XML文件,每一個XML元素是一個標題內容,該元素具有一個頁碼屬性用來存放該標題所在頁碼的信息;(13)把無層次關系的XML文件按前綴大小關系重組建立新的章節元素,該元素有一個子元素是標題元素,有兩個屬性存放該元素的頁碼范圍。

根據本發明所述的對電子圖書進行快速語義標注的方法,其特征在于對所述目錄元素進行語義標注的方法采用多元數組法或者知識點法,并且均通過手工填加。

根據本發明所述的對電子圖書進行快速語義標注的方法,其特征在于還包括如下步驟:(5)建立一個數據庫,把所述目錄結構文件和所述多個頁文件保存于數據庫中;(6)通過語義檢索在目錄結構文件中對目錄元素進行檢索,根據所檢索到的目錄元素所指向的頁碼在所述數據庫中檢索頁文件。

此外,本發明還提供了一種與上述對電子圖書進行快速語義標注方法相對應的系統。

本發明章節目錄是基于XML技術來實現,XML的結構性強、易于計算機程序讀寫,所以在拆分、形成結構、檢索等環節是可以通過計算機程序處理。此外由于語義描述是采取了多維陣列的方式,每一維陳列反映了該章節的一個完整語義,因此可以從多個角度來概括一個章節的內容。借助計算機程序實現對電子圖書進行自動拆分處理,全面提高了對電子圖書進行拆分的效率,同時也不影響到檢索效果。同時配合上述拆分方法,設計出一種通過對電子圖書的目錄結構進行簡單的語義標注,提高了語義標注的效率。

附圖說明

圖1是本發明對電子圖書進行快速語義標注的方法的數據處理流程圖。

具體實施方式

為使本發明的上述目的、特征和優點更加明顯易懂,下面結合附圖和具體實施方式對本發明作進一步詳細的說明。

圖1是本發明對電子圖書進行快速語義標注的方法的數據處理流程圖,其具體包括如下步驟:

(1)以獨立于電子圖書的方式建立用于描述電子圖書的結構的目錄結構文件,把電子圖書的章節目錄提取出來,并建立樹狀結構層次關系,同時每個章節元素含有頁碼信息的屬性;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科希望軟件股份有限公司,未經北京中科希望軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201110289165.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 清纯唯美经典一区二区| 一区二区三区欧美视频| 素人av在线| 国产理论一区| 国产一区日韩精品| 国产一区二三| 国产福利一区在线观看| 国产精欧美一区二区三区久久| 一区二区中文字幕在线观看| 欧美日韩一区二区三区在线播放| 久久夜色精品国产亚洲| 在线精品一区二区| 午夜无遮挡| 91麻豆精品国产综合久久久久久| 99精品一区| xxxx国产一二三区xxxx| 91国内精品白嫩初高生| 欧美一区二区性放荡片| 久久99精品国产99久久6男男| 97国产婷婷综合在线视频,| 国产剧情在线观看一区二区| 日本边做饭边被躁bd在线看 | 久久免费福利视频| 99国产精品免费| 狠狠色依依成人婷婷九月| 欧美一区二区三区激情| 精品一区二区三区视频?| 国产精品视频tv| 国产精品色在线网站| 欧美日韩国产123| 久久99国产视频| 亚洲精品一区在线| 日韩av中文字幕第一页| 国产欧美三区| 国产真实乱偷精品视频免| 久久婷婷国产综合一区二区| 国产在线不卡一| 久久午夜精品福利一区二区| 欧美日韩国产色综合一二三四| 爽妇色啪网| 久精品国产| 麻豆国产一区二区| 国产欧美一区二区三区沐欲| 国产天堂一区二区三区| 一区二区在线国产| 中文字幕日韩精品在线| 91av一区二区三区| 久久久久亚洲精品视频| 男女午夜爽爽| 26uuu亚洲国产精品| 国产一区亚洲一区| 国产亚洲精品久久19p| 夜夜躁狠狠躁日日躁2024| 国产精品国产三级国产播12软件| 亚洲国产日韩综合久久精品| 国产精品一区二区免费| 少妇bbwbbwbbw高潮| 91精品国产91热久久久做人人| 国产中文字幕91| 欧美日韩三区| 色偷偷一区二区三区| 国产91精品一区二区麻豆亚洲| 年轻bbwbbw高潮| 国产videosfree性另类| 性国产videofree极品| 久久精品一| 久99久视频| 中文字幕日韩有码| 欧美日韩中文国产一区发布 | 91偷拍网站| 精品综合久久久久| 国产极品一区二区三区| 国产精品国精产品一二三区| 毛片大全免费观看| 欧美日韩国产精品一区二区| 国产在线观看免费麻豆| 二区三区视频| 欧美精品免费视频| 欧美hdfree性xxxx| xoxoxo亚洲国产精品| 久久国产欧美一区二区免费| 蜜臀久久精品久久久用户群体|