日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種對電子文件進行語義檢索的方法和系統無效

專利信息
申請號: 201210236309.1 申請日: 2012-07-09
公開(公告)號: CN102799661A 公開(公告)日: 2012-11-28
發明(設計)人: 張訓軍 申請(專利權)人: 北京中科希望軟件股份有限公司
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 暫無信息 代理人: 暫無信息
地址: 100190 北京市海*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 電子 文件 進行 語義 檢索 方法 系統
【說明書】:

技術領域

發明涉及數字圖書領域,尤其是涉及一種對電子圖書中的電子文件進行語義檢索的方法和系統。

背景技術

數字出版的核心競爭力是對數字內容的快速檢索與方便查閱,而快速檢索與方便查閱的核心是語義檢索,目前基于電子書的語義檢索在國內還是空白。

目前各大圖書館的電子版圖書的檢索方法有三種,一是按傳統的各種分類方法進行檢索,二是按傳統的CPI數據查找,三是按關鍵字檢索(這種方法在圖書的檢索中非常少),所有方法的檢索結果是一本完整的圖書。目前大部分電子書是沒有語義內容的,但是從2011年開始,隨著EPUB3.0的發展,逐漸會產生了一些具有語義的電子書。而本發明正是基于這一變化,可以實現通過語義來檢索,返回的結果也是圖書的一部分。特別是對圖書的圖片、音視頻、動畫、小程序等的檢索具有明顯優勢,因為這些內容通過目前傳統的方式是檢索不到的。這對圖書檢索技術是一個很大的進步。

發明內容

鑒于現有技術中存在的問題,本發明的目的在于提供一種對電子文件進行語義檢索的方法,該方法包括如下步驟:步驟(1)在數據庫中以結構文件形式建立一個相近詞的字典;步驟(2)確認待處理的電子文件是否包含語義描述內容;步驟(3)接受用戶查詢條件,然后對該條件進行中文分詞,獲得若干詞匯;步驟(4)詞匯匹配,依據中文分詞后的詞匯,然后再讀取一個或多個電子文件的每一個語義描述中的項目名與語義內容,把這些內容與上一步獲得的中文分詞詞匯進行比較,如果是相同或者相近,則返回該項目名稱及對應的語義內容;步驟(5)向外部顯示所有的返回的項目名稱及對應的語義內容,供用戶選擇其中的一部分;步驟(6)根據用戶的選擇,顯示該項目名稱與語義內容所對應的圖片、視頻、文字塊內容。

進一步,本發明方法中的步驟(1)進一步包括:在數據庫中建立一張表,表中至少有兩個字段,一是用于存儲詞條,另一個用于存儲相近詞義的I?D號,如果兩個詞條擁有相同的詞義ID號,即理解為相近詞。

進一步,本發明方法中的步驟(3)進一步包括:把查詢條件視為以字為元素的數組;以第一個元素為起點,取出所有連續組合;以第二個元素為起點,取出所有連續組合;以此類推,取出最后一個元素的組合;建立一個字典,該字典中按常用、不常用的分級方式存儲詞組;在常用詞字典中找出上述取出的組合;如果沒有常用詞,再在不常用詞典中查找,如果有則記為分詞詞匯。

進一步,本發明方法中的步驟(4)進一步包括:

先把分出的詞匯與項目名稱對應,找出所有相同或相近的,返回項目名稱及對應的語義內容,然后再與語義內容比較,如果語義內容中包含了分出的詞匯,則返回項目名稱及對應的語義內容。

此外,本發明還提供了一種對電子文件進行語義檢索的系統,該系統包括:數據庫,在該數據庫中以結構文件形式存儲有一個相近詞的字典;確認模塊,用于確認待處理的電子文件是否包含語義描述內容;中文分詞模塊,用于在接受用戶查詢條件后對該條件進行中文分詞,獲得若干詞匯;詞匯匹配模塊,依據中文分詞后的詞匯,然后再讀取一個或多個電子文件的每一個語義描述中的項目名與語義內容,把這些內容與上一步獲得的中文分詞詞匯進行比較,如果是相同或者相近,則返回該項目名稱及對應的語義內容;語義描述顯示模塊,向外部顯示所有的返回的項目名稱及對應的語義內容,供用戶選擇其中的一部分;內容顯示模塊,根據用戶的選擇,顯示該項目名稱與語義內容所對應的圖片、視頻、文字塊內容。

進一步,在數據庫中建立一張表,表中至少有兩個字段,一是用于存儲詞條,另一個用于存儲相近詞義的ID號,如果兩個詞條擁有相同的詞義ID號,即理解為相近詞。

進一步,本發明系統中的中文分詞模塊把查詢條件視為以字為元素的數組;以第一個元素為起點,取出所有連續組合;以第二個元素為起點,取出所有連續組合;以此類推,取出最后一個元素的組合;建立一個字典,該字典中按常用、不常用的分級方式存儲詞組;在常用詞字典中找出上述取出的組合;如果沒有常用詞,再在不常用詞典中查找,如果有則記為分詞詞匯。

進一步,本發明系統中的詞匯匹配模塊先把分出的詞匯與項目名稱對應,找出所有相同或相近的,返回項目名稱及對應的語義內容,然后再與語義內容比較,如果語義內容中包含了分出的詞匯,則返回項目名稱及對應的語義內容。

本發明所述的具有以下優點:可以對具有語義描述的電子書進行檢索,返回的結果也可以是圖書的一部分。特別是對圖書的圖片、音視頻、動畫、小程序等的檢索具有明顯優勢。

附圖說明

圖1是本發明所述的方法的處理流程圖。

具體實施方式

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科希望軟件股份有限公司,未經北京中科希望軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210236309.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩美一区二区三区| 国产一区二区中文字幕| 亚洲欧美一区二区三区1000 | 日韩精品中文字幕一区二区三区 | 精品国产乱码久久久久久虫虫| 国产一区二区免费电影| 国产午夜精品av一区二区麻豆| 国产日韩欧美精品| 久久福利免费视频| 午夜精品一区二区三区在线播放| 玖玖国产精品视频| 欧美日韩中文字幕一区二区三区 | 午夜三级大片| 国产清纯白嫩初高生在线观看性色| 亚洲午夜精品一区二区三区电影院 | 99精品免费在线视频| 国产日韩一区二区三免费| 欧美一区二区三区三州| 国产欧美亚洲一区二区| 日韩欧美国产中文字幕| 欧美精品一级二级| 国产区91| 国产午夜亚洲精品羞羞网站| 欧美高清视频一区二区三区| 日本精品一二区| 国产精品美乳在线观看 | 欧美乱大交xxxxx古装| 天啦噜国产精品亚洲精品| 国产精品视频免费看人鲁| 欧美一区二区久久久| 亚洲精品老司机| 久久久精品中文| 久久精品综合| 51区亚洲精品一区二区三区| 国产精品亚洲精品一区二区三区| 欧美日韩精品影院| 午夜无人区免费网站| 国产一区二区精品在线| 国产一区2区3区| 欧美日韩一区电影| 国产一区在线免费| 欧美日韩卡一卡二| 国产日韩一区二区三区| 91精品系列| 亚洲欧美制服丝腿| 国产电影一区二区三区下载| 国产精品尤物麻豆一区二区三区| 欧美一区二区三区久久| 香蕉久久国产| 人人玩人人添人人澡97| 一区二区三区国产精品视频| 亚洲精品国产久| 日本一级中文字幕久久久久久| 国产欧美日韩一级大片| 在线观看欧美日韩国产| 91久久精品在线| 亚洲欧美一二三| 狠狠色噜噜狠狠狠狠色综合久老司机| 欧美精品日韩精品| 97国产精品久久| 欧美性二区| 精品亚洲午夜久久久久91| 色一情一乱一乱一区99av白浆| 国产91热爆ts人妖在线| 欧美乱妇在线视频播放| 国产999精品久久久久久绿帽| 丝袜脚交一区二区| 国产精品久久久久99| 国产白嫩美女在线观看| 午夜av电影院| 国产精品天堂网| 97视频精品一二区ai换脸| 欧美国产一区二区在线| 日韩一级片免费观看| 香港三日本8a三级少妇三级99 | 亚洲自拍偷拍一区二区三区| 欧美一区视频观看| 精品视频在线一区二区三区| 精品久久久久久中文字幕| 免费看农村bbwbbw高潮| 国产日韩欧美网站| 国产精品不卡在线|