[發明專利]代碼生成方法、代碼生成裝置和電子設備有效
| 申請號: | 201810988503.2 | 申請日: | 2018-08-28 |
| 公開(公告)號: | CN109241322B | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 傅朝友;宋俍辰;王國利;張騫;黃暢 | 申請(專利權)人: | 北京地平線機器人技術研發有限公司 |
| 主分類號: | G06F16/532 | 分類號: | G06F16/532;G06T9/00;G06N3/04 |
| 代理公司: | 北京彩和律師事務所 11688 | 代理人: | 劉磊;閆桑田 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 代碼 生成 方法 裝置 電子設備 | ||
公開了一種代碼生成方法、代碼生成裝置和電子設備。該方法包括:通過深度神經網絡從輸入數據集獲得第一長度的第一代碼,所述深度神經網絡的每個神經元輸出所述第一代碼的一位代碼;通過神經元融合層將所述深度神經網絡的神經元劃分為多個分組;以及,選擇所述每個分組中的一個神經元的輸出以生成第二長度的第二代碼,所述第二長度小于所述第一長度。這樣,可以得到更精確的代碼生成模型,從而減小所生成的代碼的冗余。
技術領域
本申請涉及數據處理領域,且具體地,涉及一種代碼生成方法、代碼生成裝置和電子設備。
背景技術
隨著互聯網技術的高速發展,比如圖像的多媒體數據呈爆炸式增長,且人們對于多媒體數據的檢索需求也日益增長。
由于采用哈希碼可以降低圖片特征的維度以及提高響應速度的優勢,因此廣泛地用于解決大規模圖像檢索的問題。
但是,利用傳統的深度監督哈希算法生成一定長度的二值哈希碼時,很容易產生冗余現象。這是因為哈希碼中的不同位的重要性是不同的,有的位對于檢索精度的影響很大,去除后會導致檢索精度大幅降低;而有的位的去除對于檢索精度幾乎沒有影響;甚至有些位的去除能夠提高檢索精度。
因此,期望提供能夠減少代碼冗余的改進的代碼生成方法。
發明內容
為了解決上述技術問題,提出了本申請。本申請的實施例提供了一種代碼生成方法、代碼生成裝置和電子設備,其通過神經元融合層融合深度神經網絡的神經元以生成較短的代碼,從而得到更精確的代碼生成模型,減小所生成的代碼的冗余。
根據本申請的一個方面,提供了一種代碼生成方法,包括:通過深度神經網絡從輸入數據集獲得第一長度的第一代碼,所述深度神經網絡的每個神經元輸出所述第一代碼的一位代碼;通過神經元融合層將所述深度神經網絡的神經元劃分為多個分組;以及,選擇所述每個分組中的一個神經元的輸出以生成第二長度的第二代碼,所述第二長度小于所述第一長度。
在上述代碼生成方法中,所述神經元融合層通過基于驗證數據集的訓練得到,所述訓練過程包括:計算所述深度神經網絡的每個神經元的冗余度,所述冗余度表示所述神經元對應的精度改變程度;以及,通過訓練所述神經元融合層以更新所述每個神經元之間的鄰接關系以使得冗余度更小。
在上述代碼生成方法中,所述深度神經網絡通過基于訓練數據集的訓練得到,所述驗證數據集是從所述訓練數據集隨機劃分得到的。
在上述代碼生成方法中,所述訓練過程進一步包括:基于所述每個神經元之間的鄰接關系對所述神經元融合層的參數進行二值化;以及,基于所述二值化的參數確定所述神經元劃分為的多個分組。
在上述代碼生成方法中,所述訓練過程進一步包括:通過所述深度神經網絡和所述神經元融合層從所述訓練數據集獲得驗證代碼;通過所述驗證代碼計算訓練誤差;以及,基于所述訓練誤差以反向傳播訓練所述深度神經網絡和所述神經元融合層。
在上述代碼生成方法中,在選擇所述每個分組中的一個神經元的輸出以生成第二長度的第二代碼之后進一步包括:確定所述第二代碼的位數是否小于或者等于預定閾值;響應于所述第二代碼的位數大于所述預定閾值,通過另一神經元融合層將所述多個分組合并以減小所述分組的數目;以及,選擇所述合并后的每個分組中的一個神經元的輸出以生成第三長度的第三代碼,所述第三長度小于所述第二長度。
在上述代碼生成方法中,所述深度神經網絡是深度哈希網絡,且所述深度神經網絡的每個神經元的輸出是哈希碼中的一位。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京地平線機器人技術研發有限公司,未經北京地平線機器人技術研發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810988503.2/2.html,轉載請聲明來源鉆瓜專利網。





