[發明專利]一種基于方位編碼的相似數據搜索方法、系統及電子設備在審
| 申請號: | 202310583682.2 | 申請日: | 2023-05-19 |
| 公開(公告)號: | CN116628280A | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 馮小康;王江;孫華錦 | 申請(專利權)人: | 山東云海國創云計算裝備產業創新中心有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06F16/901;G06F18/2135;G06F18/22 |
| 代理公司: | 北京三聚陽光知識產權代理有限公司 11250 | 代理人: | 陳剛 |
| 地址: | 250101 山東省濟南市高*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 方位 編碼 相似 數據 搜索 方法 系統 電子設備 | ||
1.一種基于方位編碼的相似數據搜索方法,其特征在于,所述方法包括:
獲取指定查詢數據與給定數據集,所述給定數據集包括多項基本數據,所述指定查詢數據與多項所述基本數據均為非結構化數據;
對所述指定查詢數據與多項所述基本數據進行特征向量提取,生成相對應的多維特征向量,并根據所述多維向量在多維向量空間中確定與所述指定查詢數據對應的查詢點以及與多項基本數據對應的多個數據點;
針對多個所述數據點構造近鄰圖,在所述近鄰圖中為每個所述數據點的多個鄰居點進行方位編碼,確定多個所述鄰居點相應的向量方位編碼;
基于所述近鄰圖以及所述向量方位編碼在多個所述數據點中進行最近鄰搜索,以確定所述查詢點的最近鄰數據點;
確定所述最近鄰數據點對應的所述基本數據為所述給定查詢數據對應的相似數據。
2.根據權利要求1所述的方法,其特征在于,針對多個所述數據點構造近鄰圖,包括:
依次選取多個所述數據點作為頂點;
確定所述頂點與其他多個所述數據點之間的距離,選取與所述頂點間距離最小的多個所述數據點作為所述頂點的鄰居點;
利用有向邊將所述頂點與相應的多個所述鄰居點連接,有向邊從所述頂點指向所述鄰居點。
3.根據權利要求1所述的方法,其特征在于,在所述近鄰圖中為每個所述數據點的多個鄰居點進行方位編碼,確定多個所述數據點相應的向量方位編碼,包括:
針對所述給定數據集對應的多個所述數據點相應的所述多維特征向量進行主成分分析,確定主分量投影矩陣;
在所述近鄰圖中,根據所述主分量投影矩陣計算確定所述數據點對應的所述鄰居點相對該數據點的方位編碼串作為所述鄰居點對應的所述向量方位編碼。
4.根據權利要求3所述的方法,其特征在于,針對所述給定數據集對應的多個所述數據點相應的所述多維特征向量進行主成分分析,確定主分量投影矩陣,包括:
使用主成分分析方法計算出多個所述數據點相應的所述多維特征向量的前g′個主分量以構成所述主分量投影矩陣;
所述主分量:
其中表示所述主分量中第i個綜合指標分量,所述主分量由g′個兩兩相互正交的向量構成,g′=log2g。
5.根據權利要求4所述的方法,其特征在于,根據所述主分量投影矩陣計算確定所述數據點對應的所述鄰居點相對該數據點的方位編碼串,包括:
對于每個所述給定數據集中的每個所述數據點令表示在近鄰圖中的一個所述鄰居點,利用所述主分量投影矩陣,計算相對于的方位編碼串:
Cy=c1c2…ci…cg′
其中,ci表示所述方位編碼串中的第i位編碼。
6.根據權利要求1所述的方法,其特征在于,基于所述近鄰圖以及所述向量方位編碼在多個所述數據點中進行最近鄰搜索,以確定所述查詢點的最近鄰數據點,包括:
從多個所述數據點中隨機選取一個作為最近鄰候選點;
基于所述近鄰圖確定所述最近鄰候選點的多個鄰居點;
確定所述查詢點相對所述最近鄰候選點的向量方位編碼,并結合所述最近鄰候選點的多個所述鄰居點相應的所述向量方位編碼,確定所述查詢點與多個所述鄰居點之間的漢明距離;
選取與所述查詢點之間漢明距離最小的多個鄰居點,并計算這多個鄰居點與所述查詢點之間的原始距離;
選取與所述查詢點之間原始距離最小的點作為待定點,將所述待定點與所述查詢點之間的原始距離與所述最近鄰候選點與所述查詢點之間的原始距離進行對比;
響應于所述待定點對應的所述原始距離小于所述最近鄰候選點對應的所述原始距離,選取所述待定點作為新的最近鄰候選點繼續搜索;
響應于所述待定點對應的所述原始距離不小于所述最近鄰候選定對應的所述原始距離,確定所述最近鄰候選點為所述查詢點對應的所述最近鄰數據點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東云海國創云計算裝備產業創新中心有限公司,未經山東云海國創云計算裝備產業創新中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310583682.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多功能手術器械臺
- 下一篇:一種具有防涂料掉落的吊頂噴涂機構





