[發(fā)明專利]一種全文檢索文檔數(shù)據(jù)庫(kù)的方法及裝置無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201010195408.0 | 申請(qǐng)日: | 2010-05-31 |
| 公開(公告)號(hào): | CN102262640A | 公開(公告)日: | 2011-11-30 |
| 發(fā)明(設(shè)計(jì))人: | 徐銳;陳旭毅;吳青發(fā) | 申請(qǐng)(專利權(quán))人: | 中國(guó)移動(dòng)通信集團(tuán)貴州有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京德琦知識(shí)產(chǎn)權(quán)代理有限公司 11018 | 代理人: | 王一斌;王琦 |
| 地址: | 550004*** | 國(guó)省代碼: | 貴州;52 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 全文 檢索 文檔 數(shù)據(jù)庫(kù) 方法 裝置 | ||
1.一種全文檢索文檔數(shù)據(jù)庫(kù)的方法,其特征在于,該方法包括:
查詢文檔中的附件并對(duì)查詢得到的附件按照預(yù)先設(shè)置的策略進(jìn)行文檔轉(zhuǎn)換;
按照業(yè)務(wù)分類文檔數(shù)據(jù)庫(kù)中的文檔,生成文檔數(shù)據(jù)子庫(kù);
為生成的文檔數(shù)據(jù)子庫(kù)建立全文索引目錄,并存儲(chǔ)在預(yù)先設(shè)置的關(guān)系數(shù)據(jù)庫(kù)中;
接收用戶輸入的搜索關(guān)鍵字詞,匹配關(guān)系數(shù)據(jù)庫(kù)中的全文索引目錄,獲取匹配的全文索引目錄對(duì)應(yīng)的文檔數(shù)據(jù)庫(kù)中的文檔。
2.如權(quán)利要求1所述的方法,其特征在于,進(jìn)行文檔轉(zhuǎn)換后的文檔結(jié)構(gòu)為可擴(kuò)展標(biāo)記語(yǔ)言文檔結(jié)構(gòu)。
3.如權(quán)利要求2所述的方法,其特征在于,所述接收用戶輸入的搜索關(guān)鍵字詞,匹配關(guān)系數(shù)據(jù)庫(kù)中的全文索引目錄,獲取匹配的全文索引目錄對(duì)應(yīng)的文檔具體包括:數(shù)據(jù)庫(kù)中的文檔文檔數(shù)據(jù)庫(kù)中的搜索程序接收用戶輸入的搜索關(guān)鍵字詞,根據(jù)搜索關(guān)鍵字詞搜索關(guān)系數(shù)據(jù)庫(kù)中的全文索引目錄,查找與搜索關(guān)鍵字詞匹配的全文索引目錄,然后根據(jù)查找得到的全文索引目錄,定位該全文索引目錄對(duì)應(yīng)的文檔數(shù)據(jù)庫(kù)中的文檔,并將得到的文檔信息返回給搜索用戶。
4.如權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于,在所述接收用戶輸入的搜索關(guān)鍵字詞的步驟之后,匹配關(guān)系數(shù)據(jù)庫(kù)中的全文索引目錄的步驟之前,進(jìn)一步包括:對(duì)用戶輸入的搜索關(guān)鍵字詞進(jìn)行分詞處理。
5.如權(quán)利要求4所述的方法,其特征在于,在所述匹配關(guān)系數(shù)據(jù)庫(kù)中的全文索引目錄的步驟之后,獲取匹配的全文索引目錄對(duì)應(yīng)的文檔數(shù)據(jù)庫(kù)中的文檔的步驟之前,進(jìn)一步包括:將匹配的全文索引目錄信息作為初次搜索結(jié)果信息向用戶顯示,根據(jù)用戶從初次搜索結(jié)果信息中選擇的全文索引目錄信息,執(zhí)行所述獲取匹配的全文索引目錄對(duì)應(yīng)的文檔數(shù)據(jù)庫(kù)中的文檔的步驟。
6.如權(quán)利要求5所述的方法,其特征在于,進(jìn)一步包括:判斷文檔修改日志是否發(fā)生變化,如果是,讀取文檔修改日志,并與全文索引目錄中的索引進(jìn)行對(duì)比,獲取需要同步的文檔數(shù)據(jù),修改索引中的相應(yīng)數(shù)據(jù)。
7.如權(quán)利要求6所述的方法,其特征在于,所述判斷文檔修改日志是否發(fā)生變化,如果是,讀取文檔修改日志,并與全文索引目錄中的索引進(jìn)行對(duì)比,獲取需要同步的文檔數(shù)據(jù),修改索引中的相應(yīng)數(shù)據(jù)具體包括:
在檢測(cè)到文檔數(shù)據(jù)庫(kù)中的文檔被修改時(shí),觸發(fā)索引程序,索引程序讀取文檔的修改日志,并與全文索引目錄中的索引進(jìn)行對(duì)比,發(fā)現(xiàn)該文檔的數(shù)據(jù)發(fā)生了變化,確認(rèn)需要同步修改索引中的相關(guān)數(shù)據(jù),啟用索引同步程序?qū)υ撐臋n的索引進(jìn)行更新。
8.一種全文檢索文檔數(shù)據(jù)庫(kù)的裝置,其特征在于,該裝置包括:文檔數(shù)據(jù)庫(kù)模塊、文檔轉(zhuǎn)換模塊、關(guān)系數(shù)據(jù)庫(kù)模塊以及搜索引擎模塊,其中,
文檔數(shù)據(jù)庫(kù)模塊,用于按照業(yè)務(wù)分類文檔數(shù)據(jù)庫(kù)中的文檔,生成文檔數(shù)據(jù)子庫(kù);
文檔轉(zhuǎn)換模塊,用于查詢文檔數(shù)據(jù)子庫(kù)文檔中的附件并對(duì)查詢得到的附件進(jìn)行文檔轉(zhuǎn)換;
關(guān)系數(shù)據(jù)庫(kù)模塊,用于為生成的文檔數(shù)據(jù)子庫(kù)建立全文索引目錄;
搜索引擎模塊,用于接收用戶輸入的搜索關(guān)鍵字詞,匹配關(guān)系數(shù)據(jù)庫(kù)模塊中的全文索引目錄,獲取匹配的全文索引目錄,從文檔數(shù)據(jù)庫(kù)模塊中獲取匹配的全文索引目錄對(duì)應(yīng)的文檔。
9.如權(quán)利要求8所述的裝置,其特征在于,進(jìn)一步包括:
分詞模塊,用于接收用戶輸入的搜索關(guān)鍵字詞,根據(jù)預(yù)先設(shè)定的規(guī)則判斷是否對(duì)搜索關(guān)鍵字詞進(jìn)行分詞,如果是,將分詞后的搜索關(guān)鍵字詞輸入搜索引擎模塊,否則,直接將搜索關(guān)鍵字詞輸入搜索引擎模塊。
10.如權(quán)利要求8或9所述的裝置,其特征在于,所述文檔數(shù)據(jù)庫(kù)模塊進(jìn)一步用于存儲(chǔ)文檔修改日志,所述裝置進(jìn)一步包括:
全文索引目錄更新模塊,用于判斷文檔數(shù)據(jù)庫(kù)模塊中的文檔修改日志是否發(fā)生變化,如果是,讀取文檔修改日志,并與關(guān)系數(shù)據(jù)庫(kù)模塊中全文索引目錄中的索引進(jìn)行對(duì)比,獲取需要同步的文檔數(shù)據(jù),修改索引中的相應(yīng)數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)移動(dòng)通信集團(tuán)貴州有限公司,未經(jīng)中國(guó)移動(dòng)通信集團(tuán)貴州有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010195408.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 關(guān)系型數(shù)據(jù)庫(kù)與全文檢索相結(jié)合的檢索方法
- 基于MySQL存儲(chǔ)引擎的融合查詢方法
- 用于給安全文件,尤其是凹版印刷的安全文件例如鈔票上漆的方法和用于實(shí)現(xiàn)該方法的上漆機(jī)器
- 安全文件的防偽系統(tǒng)和防偽方法及防偽和鑒別單元
- 一種安全文檔日志管理方法及服務(wù)器
- 一種安全文檔操作的判斷方法及裝置
- 一種權(quán)限瞬時(shí)授予與收回方法及裝置
- 一種全文索引的更新方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 全文檢索系統(tǒng)及方法
- 安全文件傳輸工具的切換方法、裝置、計(jì)算機(jī)設(shè)備和介質(zhì)
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫生成方法、裝置及設(shè)備
- 數(shù)據(jù)庫(kù)
- 數(shù)據(jù)庫(kù)管理系統(tǒng)及數(shù)據(jù)庫(kù)
- 數(shù)據(jù)庫(kù)構(gòu)筑裝置、數(shù)據(jù)庫(kù)檢索裝置、數(shù)據(jù)庫(kù)裝置、數(shù)據(jù)庫(kù)構(gòu)筑方法、以及數(shù)據(jù)庫(kù)檢索方法
- 數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)處理方法
- 數(shù)據(jù)庫(kù)系統(tǒng)、數(shù)據(jù)庫(kù)更新方法、數(shù)據(jù)庫(kù)以及數(shù)據(jù)庫(kù)更新程序
- 容器數(shù)據(jù)庫(kù)
- 數(shù)據(jù)庫(kù)同步方法及數(shù)據(jù)庫(kù)
- 一種MongoDB數(shù)據(jù)庫(kù)對(duì)象復(fù)制延遲監(jiān)控方法和裝置
- 數(shù)據(jù)分布式存儲(chǔ)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 數(shù)據(jù)庫(kù)語(yǔ)句執(zhí)行方法及裝置





