[發明專利]一種基于視覺特征合成的對象識別方法在審
| 申請號: | 201710333754.2 | 申請日: | 2017-05-12 |
| 公開(公告)號: | CN107122804A | 公開(公告)日: | 2017-09-01 |
| 發明(設計)人: | 夏春秋 | 申請(專利權)人: | 深圳市唯特視科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518057 廣東省深圳市高新技術產業園*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 視覺 特征 合成 對象 識別 方法 | ||
技術領域
本發明涉及對象識別領域,尤其是涉及了一種基于視覺特征合成的對象識別方法。
背景技術
對象識別是計算機視覺領域最基礎的任務之一,也是難點問題之一。對象識別包括分類和檢測兩項任務,分類用于判斷一幅圖像是否包含某類對象,檢測則要求標出這些對象的位置和大小。按照描述的概念篩選搜集到的視覺元素,合成視覺特征,用于對象識別。對象識別是理解圖像和場景的關鍵,具有廣泛的應用前景,可用于Web圖像自動標注、海量圖像搜索、圖像內容過濾、機器人、安全監視、醫學遠程會診等多種領域。對象識別面臨很多困難,大多數常規框架,例如深層神經網絡(DNN)依靠大量的訓練樣本來構建統計模型,訓練樣本的成本太高,而且為了訓練而建立一個特定的模型不太現實,收集罕見的實例也很困難。
本發明提出了一種基于視覺特征合成的對象識別方法,先通過給定的語義屬性來合成看不見的類的視覺特征,再擴散正則化,形成整體損失函數,保留數據結構并使信息擴展到所有維度,接著通過使用交替優化獲得局部最優解,最后在獲得嵌入矩陣后從語義屬性中合成看不見類的視覺特征,應用監督分類器分類。本發明提出的零點學習框架,可以在不獲取真實圖像的情況下,對未看到的類進行視覺特征的合成;不僅擴大了分類設置,而且使得各種信息能對視覺系統進行輔助,提高了整體性能,進一步降低合成數據的成本。
發明內容
針對訓練樣本的成本太高等問題,本發明的目的在于提供一種基于視覺特征合成的對象識別方法,先通過給定的語義屬性來合成看不見的類的視覺特征,再擴散正則化,形成整體損失函數,保留數據結構并使信息擴展到所有維度,接著通過使用交替優化獲得局部最優解,最后在獲得嵌入矩陣后從語義屬性中合成看不見類的視覺特征,應用監督分類器分類。
為解決上述問題,本發明提供一種基于視覺特征合成的對象識別方法,其主要內容包括:
(一)看不見的視覺數據合成;
(二)擴散正則化;
(三)交替優化;
(四)零點識別。
其中,所述的看不見的視覺數據合成,通過給定的語義屬性來合成看不見的類的視覺特征;在訓練集f’上學習一個嵌入函數:之后,可以通過以下方式推斷
進一步地,所述的映射函數,為了合成視覺特征,最直觀的框架是學習從語義空間到視覺特征空間的映射函數:
其中,P是投影矩陣,是損失函數,Ω是其超參數λ的正則化項;
在測試之前,可以通過給定的未知實例的屬性從屬性空間合成看不見的視覺特征。
進一步地,所述的協調語義空間與視覺特征空間,引入一個輔助隱藏空間來協調語義空間與視覺特征空間,其中可以讓保留視覺和語義空間的內在數據結構信息:
其中,潛在嵌入空間從分解,從分解;和是兩個投影矩陣;Ω1是對偶圖。
其中,所述的擴散正則化,考慮正交旋轉,即QQT=I,有(I是單位矩陣);
從等式(3)中,最佳合成數據為其中首先證明旋轉后總體差異不會改變;在旋轉之前,是集中的,即的原始總體方差Γ為旋轉Q后,有每個維度的新方差為σ′,每個維度的方差之和為Γ′;
總體方差Γ傾向于擴展到所有的學習維度,以便恢復的真實數據分布;
根據等式(6),有在學習框架中最小化Π,找到正交旋轉:
上式表明,最小化Π相當于最大化擴散標準差的總和;
擴散標準偏差和正交旋轉之和的關系為:
其中,||·||2,1是矩陣的l2,1范數;根據等式(5)和(6),可以最大化從而使Π最大化;可以將等式(3)和(5)組合,擴散正則化,形成整體損失函數;
上式將重建誤差從屬性最小化到視覺特征,同時保留數據結構并使信息擴展到所有維度。
其中,所述的交替優化,通過使用交替優化獲得局部最優解,Q=I和P的初始化可以通過獲得。
進一步地,所述的-步驟,通過固定P和Q,可以最小化等式(7):
其中,額外項是根據等式(4)約束的的集中式;
最小可以通過將等式(10)的偏導數設置為零得到,如上式所示。
進一步地,所述的-步驟,通過固定P和可以最小化等式(7):
需要用等式(10)的正交約束求解Q;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市唯特視科技有限公司,未經深圳市唯特視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710333754.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于數據安全的混合聚類方法
- 下一篇:一種用戶聚類方法和裝置





