[發明專利]一種均勻隨機錨點生成方法及錨點自適應多視圖聚類方法在審
| 申請號: | 202210825866.0 | 申請日: | 2022-07-13 |
| 公開(公告)號: | CN115438710A | 公開(公告)日: | 2022-12-06 |
| 發明(設計)人: | 紀霞;席華梅 | 申請(專利權)人: | 安徽大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 合肥市澤信專利代理事務所(普通合伙) 34144 | 代理人: | 方榮肖 |
| 地址: | 230601 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 均勻 隨機 生成 方法 自適應 視圖 | ||
本發明涉及一種均勻隨機錨點生成方法及錨點自適應多視圖聚類方法。錨點生成方法包括如下步驟:第一步:對視圖進行歸一化處理得到多個樣本點;第二步:將多個所述樣本點映射到一個坐標系中,計算每個樣本點到原點的距離;按照距離的遠近將樣本點劃分到多個距離類別中;第三步:根據距離類別將多個樣本點所在的區域劃分為若干區塊,并使每個區塊內具有相同數量的樣本點;第四步:在每個區塊中隨機提取相同數量的多個樣本點作為錨點;多個錨點合并為錨點集。上述均勻隨機錨點生成方法以較低的運行時間生成更具代表性的錨點,更好地表示每個視圖的樣本點集的潛在結構,兼顧了錨點生成方法的高效率與高代表性。
技術領域
本發明涉及技術領域,特別是涉及一種均勻隨機錨點生成方法、一種基于錨點的自適應多視圖聚類方法。
背景技術
隨著傳感器和互聯網的快速普及,同一對象通常能夠在多個視圖下進行采集和表達。例如,不同的新聞機構報道的同一事件;不同監控視角下的同一物體;不同的語言翻譯的同一文本。所有這些都被稱為多視圖數據,它們往往提供互補和兼容的信息,充分學習和利用多視圖來分析標簽信息未知的數據,稱為多視圖學習。
在多視圖數據的處理過程中,為了提高每個視圖數據的處理效率,通常采用在視圖中提取錨點從而簡化運算量。其中,錨點用以表征視圖數據的潛在結構。
現有的錨點生成方法中,隨機選擇生成錨點策略具有最佳的時效性,但其選擇的錨點不具備對多視圖數據的代表性。K-Means錨點生成策略雖然能選擇出具有代表性的錨點,但由于計算的復雜性使其難以應用在大規模多視圖數據中。
發明內容
基于此,有必要針對現有錨點生成方法難以在保證錨點具有代表性的同時提高錨點生成效率的問題,提供一種均勻隨機錨點生成方法及錨點自適應多視圖聚類方法。一種均勻隨機錨點生成方法,其包括如下步驟:
第一步:對視圖進行歸一化處理得到多個樣本點;
第二步:將多個樣本點映射到一個坐標系中,計算每個樣本點到原點的距離;進而將所有樣本點按照距離的遠近進行分類,得到多個距離類別;
第三步:根據距離類別將多個樣本點所在的區域劃分為若干區塊,并使每個區塊內具有相同數量的樣本點;
第四步:在每個區塊中隨機提取相同數量的多個樣本點作為錨點。
上述均勻隨機錨點生成方法通過對樣本點測量相對距離,并根據距離對樣本點所在區域進行劃分,通過隨機選取的方式在每個區塊中生成相同數量的錨點,從而以較低的運行時間生成更具代表性的錨點,更好地表示每個視圖的樣本點集的潛在結構,兼顧了錨點生成方法的高效率與高代表性。
在其中一個實施例中,區塊的劃分方法如下:
設樣本點集X為:X=[x1,x2,x3,...,xn]T∈Rn×d,數據原點x0為:x0=[0,0,0,...,0]∈R1×d;
其中,n代表樣本點數量,d代表特征維度;
記f為X中的樣本點xi到數據原點x0的距離度量函數,di(i=1,2,...,m)表示xi到x0關于f的距離,di=f(x0,xi);將樣本點集中所有樣本點到數據原點的歐氏距離合并,得到歐氏距離集合D為:
D={d1,d2,…,dn};
按照di的數值進行升序排序,得到正序距離集合D’為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽大學,未經安徽大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210825866.0/2.html,轉載請聲明來源鉆瓜專利網。





