[發(fā)明專利]一種識別清洗食材圖片的模型及識別食材類別的方法在審
| 申請?zhí)枺?/td> | 201710776039.6 | 申請日: | 2017-08-31 |
| 公開(公告)號: | CN107563439A | 公開(公告)日: | 2018-01-09 |
| 發(fā)明(設(shè)計)人: | 吳淇;肖光意;王換文;鄭瀚韜;何珍;陳浩;胡超慧;王宇 | 申請(專利權(quán))人: | 湖南麓川信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 成都環(huán)泰知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙)51242 | 代理人: | 鄒翠,李斌 |
| 地址: | 410005 湖南省長沙市高新開發(fā)區(qū)谷苑路*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識別 清洗 圖片 模型 類別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于食材識別技術(shù)領(lǐng)域,尤其涉及一種識別清洗食材圖片的模型及識別食材類別的方法。
背景技術(shù)
餐飲行業(yè)是國民經(jīng)濟支柱產(chǎn)業(yè)之一,如何對食材進行快速分類和精準檢測是餐飲行業(yè)中食材質(zhì)量控制和食品安全監(jiān)測的核心和關(guān)鍵問題。傳統(tǒng)食材采購對食材進行基于文本分類的標簽分類方式不能滿足日益增長的業(yè)務(wù)需求,如何對食材圖像實現(xiàn)快速高效的分類成為亟待解決的難題。
數(shù)據(jù)清洗是對數(shù)據(jù)進行重新審查和校驗的過程,目的在于刪除重復信息、糾正存在的錯誤,并提供數(shù)據(jù)一致性。針對圖像預處理過程中,人工方式清洗需要花費大量的人力、物力和時間成本,并且清洗過程很容易因人為因素產(chǎn)生錯誤的問題。
傳統(tǒng)的技術(shù)方案在進行圖像分類時,首先是對圖片提取一定量的特征點,其次通過數(shù)據(jù)模型來對提取的圖像信息進行建模分析及表達,并最終利用圖像匹配的方法來對圖像進行識別。利用傳統(tǒng)的圖像分類方法進行圖像分類時識別的準確率和識別效率都不能滿足實際應用的需求這一問題,在實際應用場合中,食材圖像具有背景復雜多變、旋轉(zhuǎn)、尺度、光線多變不固定等特點,傳統(tǒng)的識別方法無法在這種復雜情況下保持穩(wěn)定。
現(xiàn)在還沒有實時在線檢測的技術(shù),因此本發(fā)明構(gòu)建在線平臺,為用戶提供隨時隨地的在線識別分類的服務(wù)。
綜上所述,現(xiàn)有技術(shù)存在的問題是:
現(xiàn)有技術(shù)的圖像預處理過程中,人工方式清洗需要花費大量的人力、物力和時間成本,并且清洗過程很容易因人為因素產(chǎn)生錯誤。在實際應用場合中,食材圖像具有背景復雜多變、旋轉(zhuǎn)、尺度、光線多變不固定等特點,因此給傳統(tǒng)的圖像分類方法帶來了很大的挑戰(zhàn);傳統(tǒng)的食材類別識別算法效率低下,并且食材種類復雜,目前還未見針對肉類識別的研究。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)存在的問題,本發(fā)明提供了一種識別清洗食材圖片的模型及識別食材類別的方法。
本發(fā)明是這樣實現(xiàn)的,一種快速識別食材類別的方法,所述快速識別食材類別的方法,包括:
本發(fā)明利用基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類模型,首先給定一個K類的詞庫和Yes/No clean標簽,其中模型中兩個CNN模型將分別對類標簽和clean標簽進行卷積運算,經(jīng)過前向傳播后,優(yōu)化softmax層,然后再將特定參數(shù)在反向傳播中進行傳播。將清洗后且標注了Yes/No和類標簽的圖像,用于整個網(wǎng)絡(luò)中進行迭代,得到模型,實現(xiàn)自動清洗圖片以及識別食材類別的方法。
進一步,分別采用AlexNet,VGG-16及CaffeNet這三個卷積神經(jīng)網(wǎng)絡(luò)來對實驗數(shù)據(jù)集進行實驗,尋找最適合食材圖像分類的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu);并對卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)進行參數(shù)調(diào)優(yōu);具體包括:
步驟一、將圖片轉(zhuǎn)換成lmdb格式并計算均值文件:在caffe-master根目錄下examples文件夾下面創(chuàng)建一個demo的文件夾,來用存放配置文件和腳本文件。然后編寫一個腳本create_filelist.sh,用來生成train.txt和test.txt清單文件,調(diào)用convert_imageset命令來轉(zhuǎn)換數(shù)據(jù)格式,統(tǒng)一轉(zhuǎn)換成640*480大小。運行成功后,會在examples/demo下面生成兩個文件夾img_train_lmdb和img_test_lmdb,分別用于保存圖片轉(zhuǎn)換后的lmdb文件。
步驟二:構(gòu)建用于訓練的模型:圖片減去均值再訓練,會提高訓練速度和精度,使用計算均值的文件compute_image_mean.cpp,會在examples/myfile/下面生成一個mean.binaryproto的均值文件,再調(diào)用models/bvlc_reference_caffenet/文件夾下的模型用于訓練。
步驟三:配置train.prototxt及solver.prototxt文件中的參數(shù),用于模型進行訓練,修改train.prototxt文件的data層,以及solver.prototxt文件的batch_size以及test_iter。
步驟四:從訓練的卷積網(wǎng)絡(luò)的所有模型中,選出最低損失率和最高精確度的模型,然后用測試數(shù)據(jù)集對選定的模型進行訓練。
進一步,所述步驟一中,lmdb為容易被Caffe框架所處理的圖像格式;
所述步驟三的train.prototxt和solver.prototxt文件中,設(shè)置許多超級參數(shù)用來使卷積網(wǎng)絡(luò)獲得識別率,同時,對參數(shù)進行調(diào)優(yōu)。
本發(fā)明另一目的在于提供一種識別清洗食材圖片的模型為多任務(wù)Auto-Clean卷積神經(jīng)網(wǎng)絡(luò)模型;所述多任務(wù)Auto-Clean卷積神經(jīng)網(wǎng)絡(luò)模型包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖南麓川信息科技有限公司,未經(jīng)湖南麓川信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710776039.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





