[發明專利]一種識別清洗食材圖片的模型及識別食材類別的方法在審
| 申請號: | 201710776039.6 | 申請日: | 2017-08-31 |
| 公開(公告)號: | CN107563439A | 公開(公告)日: | 2018-01-09 |
| 發明(設計)人: | 吳淇;肖光意;王換文;鄭瀚韜;何珍;陳浩;胡超慧;王宇 | 申請(專利權)人: | 湖南麓川信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 成都環泰知識產權代理事務所(特殊普通合伙)51242 | 代理人: | 鄒翠,李斌 |
| 地址: | 410005 湖南省長沙市高新開發區谷苑路*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 清洗 圖片 模型 類別 方法 | ||
1.一種快速識別食材類別的方法,其特征在于,所述快速識別食材類別的方法,利用基于卷積神經網絡的圖像分類模型,首先將圖像輸入到神經網絡中,再利用深度學習的前向傳播和反向傳播誤差算法來最小化損失函數,更新權值后,得到一個識別模型,最后利用識別模型對新的圖像進行識別分類。
2.如權利要求1所述的快速識別食材類別的方法,其特征在于,所述快速識別食材類別的方法,分別采用AlexNet,VGG-16及CaffeNet這三個卷積神經網絡來對實驗數據集進行實驗,尋找最適合食材圖像分類的卷積神經網絡架構;并對卷積神經網絡架構進行參數調優;具體包括:
步驟一、將圖片轉換成lmdb格式并計算均值文件:在caffe-master根目錄下examples文件夾下面創建一個demo的文件夾,來用存放配置文件和腳本文件;然后編寫一個腳本create_filelist.sh,用來生成train.txt和test.txt清單文件,調用convert_imageset命令來轉換數據格式,統一轉換成640*480大小;運行成功后,在examples/demo下面生成兩個文件夾img_train_lmdb和img_test_lmdb,分別用于保存圖片轉換后的lmdb文件;
步驟二、構建用于訓練的模型:圖片減去均值再訓練,使用計算均值的文件compute_image_mean.cpp,會在examples/myfile/下面生成一個mean.binaryproto的均值文件,再調用models/bvlc_reference_caffenet/文件夾下的模型用于訓練;
步驟三、配置train.prototxt及solver.prototxt文件中的參數,用于模型進行訓練,修改train.prototxt文件的data層,以及solver.prototxt文件的batch_size以及test_iter;
步驟四、從訓練的卷積網絡的所有模型中,選出最低損失率和最高精確度的模型,然后用測試數據集對選定的模型進行訓練。
3.如權利要求2所述的快速識別食材類別的方法,其特征在于,所述步驟一中,lmdb為容易被Caffe框架所處理的圖像格式;
所述步驟三的train.prototxt和solver.prototxt文件中,設置多個超級參數用于使卷積網絡獲得識別率,同時,對參數進行調優。
4.一種如權利要求1所述快速識別食材類別的方法的識別清洗食材圖片的模型,其特征在于,所述識別清洗食材圖片的模型為多任務Auto-Clean卷積神經網絡模型;所述多任務Auto-Clean卷積神經網絡模型包括:
給定一個K類的詞庫和Yes/No clean標簽,多任務Auto-Clean卷積神經網絡模型中兩個CNN模型將分別對類標簽和clean標簽進行卷積運算,經過兩個CNN模型前向傳播后,從最后一個卷積層和第一個全連接層生成的聯合特征將會被輸入到兩個損失層中;從兩個損失層學習到的權重參數矩陣將會分解成共享層;同時,從底層的組合矩陣到第一個全連接層具有兩個CNN模型的不同信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南麓川信息科技有限公司,未經湖南麓川信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710776039.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種快速魯棒的多模態遙感影像匹配方法和系統
- 下一篇:一種圖像處理方法及裝置





