[發明專利]一種圖像標注方法在審
| 申請號: | 201710969648.3 | 申請日: | 2017-10-18 |
| 公開(公告)號: | CN107665356A | 公開(公告)日: | 2018-02-06 |
| 發明(設計)人: | 呂學強;董志安;李寶安 | 申請(專利權)人: | 北京信息科技大學;呂學強 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100192 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 標注 方法 | ||
1.一種圖像標注方法,其特征在于,包括以下步驟:
步驟1)定義圖像標注模型的目標函數;
步驟2)將圖像輸入CNN模型,得到原始圖像特征;
步驟3)對原始圖像特征進行加權;
步驟4)向LSTM模型中輸入信息;
步驟5)對預測結果產生的誤差進行反向傳播。
2.根據權利要求1所述的圖像標注方法,其特征在于,步驟1)中的目標函數為
3.根據權利要求1-2所述的圖像標注方法,其特征在于,步驟2中的原始圖像特征為CNN全連接層之前的某層卷積層的特征圖,該原始圖像特征由L個D維特征組成,每個D維特征映射到原圖像的不同位置區域。
4.根據權利要求1-3所述的圖像標注方法,其特征在于,步驟3包括利用聚焦權重向量αt對原始圖像特征進行加權,聚焦權重向量αt是一個L維向量,每一維的值大小代表著圖像不同位置特征的權重大小。
聚焦權重向量αt=softmax(Weet),其中,
et代表t時刻聚焦機制的中間狀態信息,a代表原始圖像特征,ht-1代表t-1時刻LSTM模型的輸出。
5.根據權利要求1-4所述的圖像標注方法,其特征在于,步驟4)中,LSTM的輸入信息xt=[Wyyt-1,Wzzt],其中Wy為詞編碼參數,Wz為圖像特征編碼參數,其中yt-1是圖像的正確標注詞,zt是當前時刻使用聚焦權重參數加權后的圖像特征。
6.根據權利要求1-5所述的圖像標注方法,其特征在于,圖像的正確標注詞組Y=(y0,y1,y2...yt...yn)從t=1時刻開始按順序輸入到LSTM模型當中,其中y0是一個特殊的單詞“start”,標志著標注過程的開始,yn是另一個特殊單詞“end”,標志著標注過程的結束;yt-1經詞向量編碼參數Wy編碼后輸入到LSTM模型中;zt經圖像特征編碼參數Wz編碼后輸入到LSTM模型中。
7.根據權利要求1-5所述的圖像標注方法,其特征在于,正確標注詞采用獨熱編碼形式,由一個N維向量構成,N代表單詞詞典內的單詞數目,除對應標注詞位為1外,其余位為0。
8.根據權利要求1-7所述的圖像標注方法,其特征在于,步驟5)包括利用損失函數將所有預測標注詞標注正確的log似然概率值求和后取負數,所述損失函數定義為
9.根據權利要求1-8所述的圖像標注方法,其特征在于,步驟5)還包括應用隨機梯度下降法以及鏈式求導法則不斷更新模型中的參數。
10.根據權利要求1-9所述的圖像標注方法,其特征在于,LSTM模型的計算過程公式如下:
it=σ(Wixxt+Wihht-1),
ot=σ(Woxxt+Wohht-1),
ft=σ(Wfxxt+Wfhht-1),
ct=ft⊙ct-1+it⊙h(Wcxxt+Wchht-1),
ht=ot⊙ct,
yt+1=Softmax(Wyht)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京信息科技大學;呂學強,未經北京信息科技大學;呂學強許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710969648.3/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





