[發明專利]數據檢索的方法和裝置在審
| 申請號: | 201811298840.5 | 申請日: | 2018-11-02 |
| 公開(公告)號: | CN110874417A | 公開(公告)日: | 2020-03-10 |
| 發明(設計)人: | 王正;趙章云;傅蓉蓉 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F16/51 | 分類號: | G06F16/51;G06F16/53;G06F16/583;G06F16/55;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 檢索 方法 裝置 | ||
本申請公開一種數據檢索方法,具體包括數據準備過程和數據檢索過程兩部分。在數據準備過程中,將數據庫原始數據劃分為第一類數據和第二類數據。數據檢索過程中,在第一類數據中確定第一檢索范圍,并在第一檢索范圍中檢索待檢索數據,獲得第一檢索結果。在第二類數據的全部數據中檢索待檢索數據,獲得第二檢索結果。最后,從第一檢索結果和第二檢索結果中確定最終檢索結果,以此解決數據檢索過程存在的檢索速度和檢索精度的問題。
技術領域
本申請涉及計算機領域,尤其涉及一種數據檢索的方法和裝置。
背景技術
隨著計算機技術的發展,基于圖像的檢索方法被應用于越來越多的領域。例如,公安系 統利用實時采集的人像數據與數據庫內數據進行比對,可以識別罪犯。交通系統利用實時采 集車牌信息可以準確定位車輛行駛軌跡,用于查找肇事車輛。上述應用場景中,數據庫中存 儲大量數據,且隨著采集數據的不斷增多,檢索過程中需要比對的數據也越來越多,這就給 圖像檢索速度和精度帶來了極大挑戰。如何提供一種既能保證圖像檢索精度,又能提升圖像 檢索速度的方法成為圖像檢索領域亟待解決的問題。
發明內容
本申請提供了一種數據檢索的方法和裝置,可以既保證檢索速度,又提升檢索精度。
第一方面,提供一種數據檢索的方法,該方法包括:將數據庫中N個數據劃分為第一類 數據和第二類數據,N≥2。在第一類數據中確定第一檢索范圍,并在第一檢索范圍中檢索待 檢索數據,獲得第一檢索結果,其中,第一檢索范圍中的數據為第一類數據的子集。在第二 類數據的全部范圍中檢索待檢索數據,獲得第二檢索結果。最后,從第一檢索結果和第二檢 索結果中確定待檢索數據最終的檢索結果。具體地,計算待檢索數據和第一類數據的第一檢 索范圍中各個數據的歐式距離,確定與待檢索數據距離最近的數據為第一檢索結果;以及計 算待檢索數據和各個第二類數據的歐式距離,確定與待檢索數據距離最近的數據為第二檢索 結果;再取與待檢索數據歐式距離最近的一個檢索結果為最終的檢索結果。通過上述過程的 描述,將原始數據庫中數據劃分為第一類數據和第二類數據,第一類數據是影響檢索精度的 數據,第二類數據是影響檢索速度的數據,分別在第一類數據中執行縮小檢索范圍的檢索, 在第二類數據中執行暴力檢索,再根據兩類數據的檢索結果獲得最終的檢索結果,以此實現 既保證檢索精度,又保證檢索速度的目的。
在一種可能的實現方式中,按照聚類算法將所述N個數據劃分為M個簇,每個數據對應 一個簇,每個簇有一個中心點,每個數據與其所歸屬的簇的中心點具有接近的相似度,M≥2, 每個簇的簇索引用于唯一標識一個簇。那么,第二類數據為各個簇的邊緣點的數據的集合, 第一類數據為原始數據庫中除第二類數據以外的其他數據的集合。通過上述描述,可以將原 始數據劃分為兩類數據,進而識別出影響檢索精度的第二類數據。
可選地,第二類數據為各個簇的邊緣點的數據的集合。邊緣點為以其為中心,第一閾值 為半徑的范圍內包含兩個或兩個以上簇的數據的數據。則第一類數據為原始數據庫中除第二 類數據以外的數據。
在另一種可能的實現方式中,還可以按照預置算法將第一類數據劃分為多個層,每個層 中包括至少一個第一類數據,每個第一類數據歸屬于一個層,每個層的層索引用于唯一標識 一個層。通過上述描述,將第一類數據劃分為多個層,數據檢索中可以結合第一類數據的簇 和層的劃分選擇檢索范圍,在第一類數據中實現縮小檢索范圍的檢索,減少檢索時間,提升 檢索效率。
在另一種可能的實現方式中,將N個數據劃分為第一類數據和第二類數據包括:從M個 簇中選擇比對簇;再從N個數據中選擇z個參考數據,1≤z≤N;針對每個參考數據執行下述 數據分類處理:根據當前參考數據在數據庫中檢索得到待分類數據,其中,待分類數據為與 當前參考數據相似度接近的數據;確定待分類數據是否屬于所述比對簇,如果是,將待分類 數據劃分到第一類數據,如果否,將待分類數據劃分至第二類數據。通過上述一輪數據分類 處理過程的描述,原始數據可以被劃分為一組第一類數據和第二類數據的組合,數據檢索中 可以在不同類型的數據中采用不同檢索方式,在保證檢索精度的同時,提升檢索速度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811298840.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





