[發明專利]一種基于級聯卷積神經網絡的斜眼檢測方法在審
| 申請號: | 201810186479.0 | 申請日: | 2018-03-07 |
| 公開(公告)號: | CN108416772A | 公開(公告)日: | 2018-08-17 |
| 發明(設計)人: | 范衠;盧杰威;鄭策;朱貴杰 | 申請(專利權)人: | 汕頭大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/11;G06K9/00;G06N3/04;A61B3/10 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 張澤思;周增元 |
| 地址: | 515063 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 級聯 圖像 圖像庫 分割 圖像處理算法 相對位置關系 人臉數據庫 診斷和治療 算法分割 相機拍攝 眼睛虹膜 虹膜 檢測 醫生 學習 | ||
1.一種基于級聯卷積神經網絡的斜眼檢測方法,其特征在于,包括以下步驟:
步驟1:獲取相機拍攝的斜眼圖像,并建立所述斜眼圖像的斜眼圖像庫;
步驟2:利用已建立的人臉數據庫訓練一個級聯卷積神經網絡,并確定所述級聯卷積神經網絡中的學習參數;
步驟3:利用完成訓練的級聯卷積神經網絡分割所述斜眼圖像庫中斜眼圖像的眼睛;
步驟4:利用大津算法分割斜眼圖像的眼睛虹膜;
步驟5:根據虹膜在眼睛中的相對位置關系輸出斜眼檢測的結果。
2.根據權利要求1所述的基于級聯卷積神經網絡的斜眼檢測方法,其特征在于,步驟2中,所述級聯卷積神經網絡的訓練包括級聯卷積神經網絡的結構建立和級聯卷積神經網絡的參數學習。
3.根據權利要求2所述的基于級聯卷積神經網絡的斜眼檢測方法,其特征在于,所述級聯卷積神經網絡是由兩個一樣的卷積神經網絡級聯而成,第一個卷積神經網絡用于完成對圖像中眼睛的特征點定位,并把輸出的信息輸入到第二個卷積神經網絡;第二個卷積神經網絡用于完成對圖像中眼睛的分割。
4.根據權利要求3所述的基于級聯卷積神經網絡的斜眼檢測方法,其特征在于,所述級聯卷積神經網絡的訓練包括級聯卷積神經網絡的結構建立包括確定神經網絡卷積層的層數和每個卷積層的特征圖數、反卷積層的層數和每個反卷積層的特征圖數、全連接層的層數和每個全連接層的特征圖數、池化層的層數、卷積層所用的卷積核的大小、反卷積層所用的反卷積核的大小、池化層所用的采樣核的大小,還有訓練步長。
5.根據權利要求4所述的基于級聯卷積神經網絡的斜眼檢測方法,其特征在于,所述級聯卷積神經網絡的參數學習是指通過不斷降低損失函數的函數值來學習深度卷積神經網絡的參數,其中,第一個卷積神經網絡的損失函數為:
其中,g和分別表示真實值和預測值,真實值是指人為標記的眼睛圖像,預測值是指用卷積神經網絡標記的眼睛圖像;每張圖像的大小為N×W×H;
第二個卷積神經網絡的損失函數為:
其中,N表示輸出的類別數目,W和H表示圖像的寬和高,g表示預測的輸出類別,n表示像素(i,j)的真實標記。
6.根據權利要求5所述的基于級聯卷積神經網絡的斜眼檢測方法,其特征在于,所述步驟5具體包括:計算所述斜眼圖像庫中斜眼圖像兩個眼角的距離D,計算眼睛中心和眼睛虹膜中心的距離T,如果T>(D/6),則輸出患有斜眼信息,否則輸出沒有患斜眼信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于汕頭大學,未經汕頭大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810186479.0/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





