[發明專利]基于深度學習的多源圖像融合和特征提取算法在審
| 申請號: | 201810879184.1 | 申請日: | 2018-08-03 |
| 公開(公告)號: | CN109308486A | 公開(公告)日: | 2019-02-05 |
| 發明(設計)人: | 周河宇;韋莎;程雨航;王偉忠;劉安安;聶為之;蘇育挺 | 申請(專利權)人: | 天津大學;中國電子技術標準化研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 損失函數 特征提取算法 正十二面體 數據庫 單個目標 多源圖像 視圖模型 最小化 三維空間 標簽 虛擬 反向傳播 目標分類 三維模型 神經網絡 虛擬相機 原始物體 重新定義 融合 測試集 訓練集 驗證集 級聯 算法 視點 拍照 輸出 學習 安置 | ||
1.一種基于深度學習的多源圖像融合和特征提取算法,其特征在于,所述方法包括以下步驟:
將數據庫中的每個三維模型置于一個虛擬的正十二面體中,將虛擬相機安置在正十二面體的均勻分布的二十個頂點上,從三維空間的視點中對原始物體進行虛擬拍照,得到單個目標的二十個視圖,構成多視圖模型數據庫;
將多視圖模型數據庫按照7:2:1的比例劃分為訓練集、測試集和驗證集,利用視圖姿態標簽這一隱變量重新定義損失函數,通過反向傳播算法最小化損失函數;
在最小化損失函數后,神經網絡最后一層通過softmax級聯輸出單個目標的多個視圖,在候選視圖姿態標簽的約束下所屬類別的得分。
2.根據權利要求1所述的一種基于深度學習的多源圖像融合和特征提取算法,其特征在于,
所述的數據庫為ModelNet40數據庫。
3.根據權利要求1所述的一種基于深度學習的多源圖像融合和特征提取算法,其特征在于,所述利用視圖姿態標簽這一隱變量重新定義損失函數具體為:
其中,R是神經網絡模型中所有超參數的集合,vi是單個視圖姿態標簽,神經網絡模型的訓練過程就是找到最優的R和vi使得最終輸出的概率P的累計乘積最大。
4.根據權利要求1所述的一種基于深度學習的多源圖像融合和特征提取算法,其特征在于,所述在候選視圖姿態標簽的約束下所屬類別的得分具體為:
確定任一視圖在候選視圖姿態標簽約束下的類別得分,將該得分累計相乘,即可以得到直方圖,用于確定目標最終的姿態及其類別。
5.根據權利要求3所述的一種基于深度學習的多源圖像融合和特征提取算法,其特征在于,所述神經網絡模型通過以下公式進行目標類別和視圖姿態標簽的判定:
與訓練階段相似,是由經過softmax分類得到的矩陣決定,最終不僅能預測出目標所屬的類別,還能預測出單個目標輸入視圖的標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學;中國電子技術標準化研究院,未經天津大學;中國電子技術標準化研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810879184.1/1.html,轉載請聲明來源鉆瓜專利網。





