[發(fā)明專利]一種計算全文檢索查全率的方法及裝置有效
| 申請?zhí)枺?/td> | 201410586251.2 | 申請日: | 2014-10-28 |
| 公開(公告)號: | CN104699733B | 公開(公告)日: | 2018-07-24 |
| 發(fā)明(設(shè)計)人: | 吝斌;馬妤晨;王欣 | 申請(專利權(quán))人: | 電信科學(xué)技術(shù)第十研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F11/36 |
| 代理公司: | 西安億諾專利代理有限公司 61220 | 代理人: | 韓素蘭 |
| 地址: | 710000*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 計算 全文 檢索 查全率 方法 裝置 | ||
本發(fā)明提供一種計算全文檢索查全率的方法及裝置,屬于計算機(jī)軟件測試技術(shù)領(lǐng)域,以解決現(xiàn)有技術(shù)中有效且可操作的計算全文檢索查全率的方法的缺失問題。本發(fā)明提供的方法計算出的查全率是相對數(shù)據(jù)庫系統(tǒng)查全率的對比值,在數(shù)據(jù)庫系統(tǒng)查全率一定的情況下,與數(shù)據(jù)庫系統(tǒng)查全率成正比關(guān)系。相比其他以估算方式給出查全率的方法,本發(fā)明的查全結(jié)果更有效且更具有操作性,在實際使用過程中提供有效的改進(jìn)依據(jù)。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)軟件測試技術(shù)領(lǐng)域,具體涉及一種計算全文檢索查全率的方法及裝置。
背景技術(shù)
信息時代產(chǎn)生了大量數(shù)字信息,其中文本信息是最基本和常用的一種形式。為了能在海量的文本信息中找到自己的所需,人們迫切需要一個高效的檢索工具,因此全文檢索技術(shù)成為國內(nèi)外學(xué)者研究的熱點。全文檢索(Full-text Retrieval)技術(shù)起源于20世紀(jì)50年代末,以各類數(shù)據(jù)為處理對象,提供依照數(shù)據(jù)資料的內(nèi)容而不是外在特征來實現(xiàn)的信息檢索手段,其主旨在于將與用戶查詢最相關(guān)的結(jié)果最先呈現(xiàn)給用戶,提高用戶體驗,典型應(yīng)用如各類搜索引擎。
隨著大數(shù)據(jù)時代的到來及互聯(lián)網(wǎng)的興起,全文檢索技術(shù)與云計算、分布式等技術(shù)相結(jié)合,提供基于海量數(shù)據(jù)的即時查詢,得到廣泛的應(yīng)用。當(dāng)前與全文檢索相關(guān)的研究大都集中在如何提高排序靠前數(shù)據(jù)的相關(guān)性方面,現(xiàn)有自然語言的切詞方面會舍棄一些虛詞等以提高索引效率,其結(jié)果將會導(dǎo)致部分?jǐn)?shù)據(jù)失真。
目前,搜索引擎主要針對提高普通的使用自然語言的用戶體驗,但是應(yīng)用于一些比較反常規(guī)的領(lǐng)域,如國安、情報等領(lǐng)域,就會導(dǎo)致部分信息不能出現(xiàn)在結(jié)果集中,而且對查全率的計算并沒有一種有效可靠的方法。當(dāng)前全文檢索的查全率一般是通過估算方式給出,與實際有較大偏差,不能準(zhǔn)確評價被測系統(tǒng)。因此需要建立一種準(zhǔn)確的計算全文檢索查全率的方法,為系統(tǒng)改進(jìn)提供依據(jù)。
發(fā)明內(nèi)容
本發(fā)明提供一種計算全文檢索查全率的方法及裝置,以解決現(xiàn)有技術(shù)中有效且可操作的計算全文檢索查全率的方法的缺失問題。
第一方面,本發(fā)明實施例公開了一種計算全文檢索查全率的方法,該方法包括:
獲取被測系統(tǒng)中的至少一個測試元素,以及存儲于數(shù)據(jù)庫系統(tǒng)的所述至少一個測試元素;
根據(jù)所述至少一個測試元素,創(chuàng)建至少一個查詢關(guān)鍵詞及其擴(kuò)展關(guān)鍵詞;
根據(jù)每個所述查詢關(guān)鍵詞及其擴(kuò)展關(guān)鍵詞,對應(yīng)從所述被測系統(tǒng)中的至少一個測試元素中獲取一個第一查詢結(jié)果,對應(yīng)從所述存儲于數(shù)據(jù)庫系統(tǒng)的所述至少一個測試元素中獲取一個第二查詢結(jié)果;
根據(jù)所述第一查詢結(jié)果和所述第二查詢結(jié)果,計算所述被測系統(tǒng)的查全率。
結(jié)合第一方面,在第一種可能的實現(xiàn)方式中,所述獲取被測系統(tǒng)中的至少一個測試元素,以及存儲于數(shù)據(jù)庫系統(tǒng)的所述至少一個測試元素包括:
獲取被測系統(tǒng)中的至少一個測試元素;
轉(zhuǎn)換所述測試元素的存儲類型,生成適合數(shù)據(jù)庫系統(tǒng)存儲的測試元素;
將所述適合數(shù)據(jù)庫存儲的至少一個測試元素存儲于數(shù)據(jù)庫系統(tǒng)中。
結(jié)合第一方面,在第二種可能的實現(xiàn)方式中,所述根據(jù)所述至少一個測試元素,創(chuàng)建至少一個查詢關(guān)鍵詞及其擴(kuò)展關(guān)鍵詞包括:
根據(jù)至少一個測試元素,收集至少一個查詢的常用關(guān)鍵詞;
排除所述查詢的常用關(guān)鍵詞中的相關(guān)性詞語,確定查詢關(guān)鍵詞,所述相關(guān)性詞語包括同義詞和近義詞;
獲取每個所述查詢關(guān)鍵詞的同義詞,確定所述查詢關(guān)鍵詞的擴(kuò)展關(guān)鍵詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電信科學(xué)技術(shù)第十研究所,未經(jīng)電信科學(xué)技術(shù)第十研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410586251.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





