[發明專利]一種基于歸納型矩陣補全的大規模社交圖像自動標注算法在審
| 申請號: | 201710036828.6 | 申請日: | 2017-01-18 |
| 公開(公告)號: | CN107590167A | 公開(公告)日: | 2018-01-16 |
| 發明(設計)人: | 陳蕾;劉夢迪;葉文采;周宇軒;楊庚;戴華 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/46;G06Q50/00 |
| 代理公司: | 南京知識律師事務所32207 | 代理人: | 李湘群 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 歸納 矩陣 大規模 社交 圖像 自動 標注 算法 | ||
1.一種基于歸納型矩陣補全的大規模社交圖像自動標注算法,其特征在于,所述算法包括以下步驟:
(1)選擇大規模社交圖像數據集,對其進行預處理后,產生用于問題模型訓練的圖像標簽的采樣矩陣;
(2)根據圖像視覺內容和語義標注一致性原則,并利用圖像標簽的低秩性和稀疏性的融合以及歸納性矩陣補全技術,對圖像自動標注問題進行建模;
(3)引入并行多塊ADMM進行問題模型求解,得到問題模型的求解結果;對求解結果進行迭代更新求解,直至收斂或滿足終止條件得到最終所需結果,進而得到補全的圖像標注結果;
(4)對新加入的圖像進行圖像標注。
2.如權利要求1所述的一種基于歸納型矩陣補全的大規模社交圖像自動標注算法,其特征在于,步驟1具體包括如下步驟:
(2-1)選擇大規模社交圖像作為數據集,對數據集中的圖像進行特征提取;
(2-2)提取圖像中底層視覺特征和圖像標注的語義特征,構建出圖像-特征矩陣和圖像-標簽矩陣;
(2-3)基于步驟2-2中所構建的矩陣,進行移除標記圖像過少的標簽等預處理,得到新的圖像-特征矩陣和圖像-標簽矩陣,其中圖像-標簽矩陣中的某些行可以是全零元素,即可以含有無標簽圖像;
(2-4)基于步驟2-3中的圖像-標簽矩陣,對其生成一個元素缺失且可能包含噪聲的圖像標簽的采樣矩陣,將其作為初始化圖像-標簽矩陣用于問題模型訓練。
3.如權利要求1所述的一種基于歸納型矩陣補全的大規模社交圖像自動標注算法,其特征在于,步驟2中所述圖像自動標注的問題模型表示如下:
其中,n和m分別表示圖像和標簽的數量,d表示圖像特征的維數;M∈Rn×m為圖像標簽的采樣矩陣,X∈Rd×n為特征-圖像矩陣,Z∈Rd×m為標簽誘導矩陣,E∈Rn×m為圖像標簽的稀疏噪聲矩陣,XΤZ為待補全的圖像-標簽矩陣;||XΤZ||*和||XΤZ||1表示為圖像-標簽矩陣的低秩性和其固有的稀疏性,||E||1表示圖像噪聲矩陣的稀疏性,Cc(XΤZ)和Ct(XΤZ)分別用來度量圖像視覺內容相似性和圖像標簽間語義相關性,λ為可調權衡參數;Ω={(i,j)|1≤i≤n,1≤j≤m,M(i,j)=1}為采樣矩陣中元素的下標集合,PΩ(·)為投影算子,定義為:
4.如權利要求1所述的一種基于歸納型矩陣補全的大規模社交圖像自動標注算法,其特征在于,步驟3具體包括如下步驟:
(4-1)采用并行多塊ADMM對問題模型進行優化求解,得到問題模型的求解結果;
(4-2)對上述求解結果進行迭代更新求解,直至收斂或滿足終止條件得到最終結果,進而得到補全的圖像標注結果。
5.如權利要求1所述的一種基于歸納型矩陣補全的大規模社交圖像自動標注算法,其特征在于,步驟4具體包括如下步驟:提取新加入圖像的特征向量,增加到特征-圖像矩陣X中,對新得到的X與求得的標簽誘導矩陣Z求內積,即XΤZ,從而得到新加入圖像的標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710036828.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種城軌列車軟件版本評估方法及系統
- 下一篇:用于關系推斷的系統和方法





