[發明專利]一種計算全文檢索查全率的方法及裝置有效
| 申請號: | 201410586251.2 | 申請日: | 2014-10-28 |
| 公開(公告)號: | CN104699733B | 公開(公告)日: | 2018-07-24 |
| 發明(設計)人: | 吝斌;馬妤晨;王欣 | 申請(專利權)人: | 電信科學技術第十研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F11/36 |
| 代理公司: | 西安億諾專利代理有限公司 61220 | 代理人: | 韓素蘭 |
| 地址: | 710000*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 計算 全文 檢索 查全率 方法 裝置 | ||
1.一種計算全文檢索查全率的方法,其特征在于,所述方法包括:
獲取被測系統中的至少一個測試元素,并在轉換所述測試元素的存儲類型且生成適合數據庫系統存儲的測試元素后,將適合數據庫存儲的所述至少一個測試元素存儲于數據庫系統中;
根據所述至少一個測試元素,創建至少一個查詢關鍵詞及其擴展關鍵詞;
根據每個查詢關鍵詞及其擴展關鍵詞,對被測系統中的至少一個測試元素進行查詢,對應獲取與所述查詢關鍵詞及其擴展關鍵詞匹配的測試元素,所述匹配的測試元素的個數記為第一查詢結果;根據每個查詢關鍵詞及其擴展關鍵詞,對存儲于數據庫系統的所述至少一個測試元素進行查詢,對應獲取與所述查詢關鍵詞及其擴展關鍵詞匹配的測試元素,所述匹配的測試元素的個數記為第二查詢結果;
計算每個查詢關鍵詞及其擴展關鍵詞對應的查全率其中bi表示第i個查詢關鍵詞及其擴展關鍵詞對應的第一查詢結果,ai表示第i個查詢關鍵詞及其擴展關鍵詞對應的第二查詢結果;計算被測系統的平均查全率其中n表示所述查詢關鍵詞的總個數。
2.根據權利要求1所述的方法,其特征在于,所述根據所述至少一個測試元素,創建至少一個查詢關鍵詞及其擴展關鍵詞包括:
根據至少一個測試元素,收集至少一個查詢的常用關鍵詞;
排除所述查詢的常用關鍵詞中的相關性詞語,確定查詢關鍵詞,所述相關性詞語包括同義詞和近義詞;
獲取每個所述查詢關鍵詞的同義詞,確定所述查詢關鍵詞的擴展關鍵詞。
3.一種計算全文檢索查全率的裝置,其特征在于,所述裝置包括:
獲取單元,用于獲取被測系統中的至少一個測試元素,并在轉換所述測試元素的存儲類型且生成適合數據庫系統存儲的測試元素后,將適合數據庫存儲的所述至少一個測試元素存儲于數據庫系統中;
創建單元,用于根據所述至少一個測試元素,創建至少一個查詢關鍵詞及其擴展關鍵詞;
查詢單元,用于根據每個所述查詢關鍵詞及其擴展關鍵詞,對應從所述被測系統中的至少一個測試元素中獲取一個第一查詢結果,對應從所述存儲于數據庫系統的所述至少一個測試元素中獲取一個第二查詢結果;
計算單元,用于根據所述第一查詢結果和所述第二查詢結果,計算所述被測系統的查全率。
4.根據權利要求3所述的裝置,其特征在于,所述創建單元具體用于:
根據至少一個測試元素,收集至少一個查詢的常用關鍵詞;
排除所述查詢的常用關鍵詞中的相關性詞語,確定查詢關鍵詞,所述相關性詞語包括同義詞和近義詞;
獲取每個所述查詢關鍵詞的同義詞,確定所述查詢關鍵詞的擴展關鍵詞。
5.根據權利要求3所述的裝置,其特征在于,所述查詢單元具體用于:
根據每個查詢關鍵詞及其擴展關鍵詞,對被測系統中的至少一個測試元素進行查詢,對應獲取與所述查詢關鍵詞及其擴展關鍵詞匹配的測試元素,所述匹配的測試元素的個數記為第一查詢結果;
根據每個查詢關鍵詞及其擴展關鍵詞,對存儲于數據庫系統的所述至少一個測試元素進行查詢,對應獲取與所述查詢關鍵詞及其擴展關鍵詞匹配的測試元素,所述匹配的測試元素的個數記為第二查詢結果。
6.根據權利要求5所述的裝置,其特征在于,所述計算單元具體用于:
計算每個查詢關鍵詞及其擴展關鍵詞對應的查全率其中bi表示第i個查詢關鍵詞及其擴展關鍵詞對應的第一查詢結果,ai表示第i個查詢關鍵詞及其擴展關鍵詞對應的第二查詢結果;
計算被測系統的平均查全率其中n表示所述查詢關鍵詞的總個數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電信科學技術第十研究所,未經電信科學技術第十研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410586251.2/1.html,轉載請聲明來源鉆瓜專利網。





