[發(fā)明專利]一種基于在線聚集的快速文本查詢方法有效
| 申請?zhí)枺?/td> | 201710647283.2 | 申請日: | 2017-08-01 |
| 公開(公告)號: | CN107480220B | 公開(公告)日: | 2021-01-12 |
| 發(fā)明(設計)人: | 伍賽;龐志飛;陳珂;陳剛;壽黎但;胡天磊 | 申請(專利權(quán))人: | 浙江大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/338 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 林超 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 在線 聚集 快速 文本 查詢 方法 | ||
1.一種基于在線聚集的快速文本查詢方法,其特征在于:所述方法步驟具體如下:
1)首先從數(shù)據(jù)庫中的文本文件整理成規(guī)定的數(shù)據(jù)模式;
2)以在線聚集的方式進行輸入查詢,所有查詢以樹的方式進行組織;
所述步驟2)具體為:
2.1)用戶將查詢需求編寫為標準的SQL語句,輸入進行查詢獲得查詢結(jié)果,所述的查詢是針對一個文本文件以在線聚集的方式進行的隨機采樣查詢;
所述步驟2.1)中的查詢是從文本文件不斷進行多次隨機采樣的查詢直到查詢結(jié)果使得用戶滿意,每次查詢都是針對文本文件進行一次的隨機采樣查詢獲得查詢數(shù)據(jù);
2.2)將當前對于文本文件進行的所有查詢以樹結(jié)構(gòu)方式組織,樹結(jié)構(gòu)中的根節(jié)點是預先建立的虛擬查詢節(jié)點,不做具體的查詢?nèi)蝿眨惠斎胍徊樵冃枨蠛笤跇浣Y(jié)構(gòu)中建立并分配一節(jié)點;并且根據(jù)當前查詢結(jié)果和之前查詢結(jié)果的比較情況,將當前查詢分配到根節(jié)點下的節(jié)點或者根節(jié)點;
2.3)每個節(jié)點在內(nèi)存上建立一個緩沖區(qū),每個節(jié)點將自身查詢對應的查詢數(shù)據(jù)保存到自身的緩沖區(qū);并且,當子節(jié)點產(chǎn)生時,若子節(jié)點的查詢數(shù)據(jù)和父節(jié)點的查詢數(shù)據(jù)相近有查詢需求重疊,則從父節(jié)點獲取其查詢數(shù)據(jù)并直接作為子節(jié)點的查詢數(shù)據(jù);
3)用不同的聚合函數(shù)計算其查詢置信度或置信區(qū)間,當置信度或置信區(qū)間滿足預設的臨界值時,查詢過程停止。
2.根據(jù)權(quán)利要求1所述的一種基于在線聚集的快速文本查詢方法,其特征在于:所述步驟1)的數(shù)據(jù)模式是由文本文件中各條記錄的各個列構(gòu)成,不同的列分別代表了不同記錄的屬性,每條記錄的每個列主要有列名稱和數(shù)據(jù)類型的兩個部分組成。
3.根據(jù)權(quán)利要求2所述的一種基于在線聚集的快速文本查詢方法,其特征在于:輸入一查詢需求進行查詢后獲得每次的單次查詢結(jié)果均存入到緩沖區(qū)中,將多次查詢的單次查詢結(jié)果取并集并實時存入覆蓋緩沖區(qū),由用戶滿意的查詢結(jié)果作為最終查詢結(jié)果,不同的查詢需求對應獲得不同的最終查詢結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學,未經(jīng)浙江大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710647283.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





