[發(fā)明專利]圖像識別深度信念網絡結構的構建方法有效
| 申請?zhí)枺?/td> | 201710106384.9 | 申請日: | 2017-02-27 |
| 公開(公告)號: | CN106991429B | 公開(公告)日: | 2018-10-23 |
| 發(fā)明(設計)人: | 馬苗;許西丹;武杰;郭敏;吳琦 | 申請(專利權)人: | 陜西師范大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 西安永生專利代理有限責任公司 61201 | 代理人: | 申忠才 |
| 地址: | 710062 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 識別 深度 信念 網絡 結構 構建 方法 | ||
一種圖像識別深度信念網絡結構的構建方法,由圖像預處理、確定圖像識別深度信念網絡結構、調整圖像識別深度信念網絡參數(shù)、對測試樣本圖像進行識別步驟組成。采用了受限玻爾茲曼機原理,將圖像輸入到受限玻爾茲曼機網絡中,得到重構誤差,確定一個隱含層節(jié)點數(shù),增加隱含層層數(shù),將訓練樣本圖像分批輸入到含有1~3層隱含層的網絡結構中迭代至指定迭代次數(shù),得到識別率,選擇識別率最高時所對應的隱含層節(jié)點數(shù),確定網絡層數(shù)和各隱含層節(jié)點數(shù),構建成圖像識別深度信念網絡結構。本發(fā)明與現(xiàn)有技術相比,具有方法簡單、魯棒性好等優(yōu)點,圖像識別率達98.62%,能有效地防止網絡的過擬合現(xiàn)象,可用于手勢、手寫數(shù)字、門牌號碼等圖像識別。
技術領域
本發(fā)明屬于圖像處理及模式識別技術領域,具體地涉及到對圖像進行識別。
背景技術
隨著機器學習的不斷完善和發(fā)展,深度學習算法越來越受到重視,其中深度信念網絡是深度學習中的一種重要算法,目前已成為圖像處理、語音分析、文檔分類等領域的研究熱點。深度信念網絡利用級聯(lián)的若干個受限玻爾茲曼機進行樣本特征的自我學習,基于概率生成模型,建立數(shù)據(jù)與標簽之間的聯(lián)合分布,通過對比散度方法更新網絡參數(shù),是一類無監(jiān)督學習與有監(jiān)督微調相結合的學習網絡。
基于深度信念網絡,研究人員在圖像分類、語音識別、文檔分類、視頻檢測等應用中取得了很多成果。細究這些應用,不難發(fā)現(xiàn),合理有效的網絡結構的構建是眾多研究人員追求的目標,是影響深度學習算法性能的關鍵組成部分,因此,如何根據(jù)特定數(shù)據(jù)集的特點快速建立一個行之有效的網絡結構具有重要意義,并得到研究人員的重視。然而,網絡結構構建過程中還存在很多問題,例如:網絡的深度(層數(shù))確定沒有可靠的理論基礎,與求解問題的復雜程度相關;在網絡深度相同的情況下,增加節(jié)點個數(shù)時識別率會提升,相應的網絡復雜度也會提高,如何平衡兩者之間的關系也是值思考的;此外,對于網絡中參數(shù)的選擇及網絡的初始化方式目前還沒有普遍適用的方法。
發(fā)明內容
本發(fā)明所要解決的技術問題在于克服現(xiàn)有技術的缺點,提供一種設計簡單、識別精度高、速度快的圖像識別深度信念網絡結構的構建方法。
解決上述技術問題所采用的技術方案是由下述步驟組成:
(1)圖像預處理
從圖像數(shù)據(jù)集中選取50400~60000張訓練樣本圖像和6000~20000張測試樣本圖像進行灰度化和大小歸一化至32×32或28×28。
(2)確定圖像識別深度信念網絡結構
1)確定第一個受限玻爾茲曼機隱含層節(jié)點數(shù)M
設定受限玻爾茲曼機隱含層節(jié)點數(shù)為M,將訓練樣本圖像分100批輸入到受限玻爾茲曼機網絡中,迭代至網絡收斂,得到訓練樣本圖像的重構誤差,重構誤差用(1)式確定:
式中m為輸入圖像的像素點個數(shù),n為每一批數(shù)據(jù)的圖像個數(shù),vi為每一批輸入的圖像矩陣,為經過隱含層hn后重構出的圖像矩陣為輸出層pf,θ為權值與偏置的集合,不斷調整M的大小,根據(jù)不同M得到的重構誤差和迭代所需時間,選擇重構誤差最小,所用時間最短的節(jié)點數(shù)M為第一個受限玻爾茲曼機隱含層hn節(jié)點數(shù),構建成在輸入層vm與輸出層pf之間含有一個隱含層hn的網絡結構。
2)確定網絡層數(shù)和各隱含層節(jié)點數(shù)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西師范大學,未經陜西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710106384.9/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





