[發明專利]一種使用二進制瓶頸神經網絡來抽取圖片特征的方法有效
| 申請號: | 201710568350.1 | 申請日: | 2017-07-13 |
| 公開(公告)號: | CN107463932B | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 張勇;朱立松 | 申請(專利權)人: | 央視國際網絡無錫有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62;G06N3/04 |
| 代理公司: | 常州佰業騰飛專利代理事務所(普通合伙) 32231 | 代理人: | 黃杭飛 |
| 地址: | 214000 江蘇省無錫市震*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 使用 二進制 瓶頸 神經網絡 抽取 圖片 特征 方法 | ||
1.一種使用二進制瓶頸神經網絡來抽取圖片特征的方法,其特征在于:包括如下步驟:
步驟1:建立一個二進制瓶頸神經網絡,該二進制瓶頸神經網絡包括輸入層、隱藏層、輸出層和鏡像層;所述隱藏層包括第一隱藏層、第二隱藏層和第三隱藏層;
步驟2:通過攝像頭獲取圖片后,將圖片進行統一處理,使圖片變為適合在二進制瓶頸神經網絡中處理的分辨率尺寸大小,所述統一處理包括放大處理和縮小處理;
對8bit編碼格式的圖片進行統一處理時,由于所述8bit編碼格式的圖片的像素值的范圍是0到255,所以處理時將所述8bit編碼格式的圖片中的所有的像素值均除以255,使其歸一化到0到1的范圍內;
步驟3:將經過統一處理的圖片輸入到所述輸入層,經過統一處理的圖片的像素值作為輸入層的狀態值;
步驟4:隱藏層獲取輸入層的狀態值,并通過以下公式1進行計算:
式中,向量x表示輸入層的狀態值,W表示從輸入層到隱藏層的權值矩陣,b表示隱藏層的偏置值,y表示隱藏層的狀態值;
每一個隱藏層均將近鄰的前一個隱藏層作為自身的輸入層,并通過公式1來獲取輸入層的狀態值;
步驟5:將隱藏層的狀態值輸入到輸出層,并計算輸出層的神經元激活概率,其計算公式2如下:
式中,向量j表示第三隱藏層的狀態值,k表示輸出層的偏置值,下標i表示輸出層的第i個元素,P表示輸出層的第i個元素激活的概率,P(Oi=1)表示Oi=1的概率,Oi只有兩個取值,即1或0,取1表示激活,取0表示非激活,公式2給出了輸出層的第i個神經元激活的概率;
神經網絡在計算的過程中首先計算輸出層的神經元激活概率值P,然后根據概率值P進行隨機采樣,從而最后得到輸出神經元的激活狀態;該神經網絡將任意一個圖片映射為一個固定長度的二進制序列碼,即,圖片的二進制特征向量;
步驟6:當需要比較圖片N和圖片M之間的相似度時,首先根據步驟1到步驟5的方法分別計算出圖片N和圖片M相應的二進制序列碼,設定計算出的圖片N的二進制序列碼為BN,計算出的圖片M的二進制序列碼為BM;
然后計算BN和BM之間的漢明距離H(BN,BM),漢明距離越小,圖片N和圖片M的相似程度越高;
步驟7:在輸出層的后方設有一個鏡像層,鏡像層是以輸出層為鏡面對隱藏層和輸入層的鏡像;鏡像層的最后一層的神經元個數與輸入層的神經元個數相同,鏡像層的倒數第二層的神經元個數與第一隱藏層的神經元個數相同。
2.如權利要求1所述的一種使用二進制瓶頸神經網絡來抽取圖片特征的方法,其特征在于:所述漢明距離是指兩個二進制序列中不同位的個數,即將兩個二進制序列進行異或后的結果中1的個數。
3.如權利要求1所述的一種使用二進制瓶頸神經網絡來抽取圖片特征的方法,其特征在于:在執行步驟7時,雖然鏡像層的神經元個數與輸入層和隱藏層相同,但是其連接權值不相同;圖片從輸入層輸入,經過二進制瓶頸層之后,從鏡像層恢復,中間在二進制瓶頸神經網絡中引入了一定的誤差,這就需要對二進制瓶頸神經網絡進行權值訓練,而權值訓練的目的是使得上述誤差最小化;所述二進制瓶頸神經網絡中,二進制神經元的個數決定了該網絡能夠傳遞的最大信息量,是整個網絡信息量傳輸的瓶頸,網絡訓練成功之后,若任意從輸入層輸入的圖片都能在鏡像層輸出與其非常相似的圖片,這說明中間的二進制神經元已經抓取到了該圖片的特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于央視國際網絡無錫有限公司,未經央視國際網絡無錫有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710568350.1/1.html,轉載請聲明來源鉆瓜專利網。





