[發(fā)明專利]一種寵物圖像識(shí)別的方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201810323793.9 | 申請(qǐng)日: | 2018-04-11 |
| 公開(公告)號(hào): | CN108460428A | 公開(公告)日: | 2018-08-28 |
| 發(fā)明(設(shè)計(jì))人: | 羅學(xué)勱;梁浩;孫力勝;吳駿 | 申請(qǐng)(專利權(quán))人: | 波奇(上海)信息科技有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 陳曉云 |
| 地址: | 200120 上海市浦東新區(qū)中國(上海*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 待處理圖像 目標(biāo)神經(jīng) 寵物圖像 方法和裝置 目標(biāo)層級(jí) 分類樹 構(gòu)建 網(wǎng)絡(luò) 數(shù)字圖像處理 寵物屬性 分類識(shí)別 分類特征 神經(jīng)網(wǎng)絡(luò) 損失函數(shù) 層級(jí) 寵物 調(diào)用 應(yīng)用 場景 緩解 | ||
本發(fā)明提供了一種寵物圖像識(shí)別的方法和裝置,涉及數(shù)字圖像處理的技術(shù)領(lǐng)域,包括:獲取待處理圖像,其中,所述待處理圖像的數(shù)量為多個(gè),且每個(gè)所述待處理圖像中均包括待識(shí)別寵物;調(diào)用預(yù)先構(gòu)建的目標(biāo)神經(jīng)網(wǎng)絡(luò),其中,所述目標(biāo)神經(jīng)網(wǎng)絡(luò)為預(yù)先通過目標(biāo)層級(jí)分類樹的層級(jí)損失函數(shù)構(gòu)建的神經(jīng)網(wǎng)絡(luò);將所述待處理圖像輸入至所述目標(biāo)神經(jīng)網(wǎng)絡(luò)中進(jìn)行識(shí)別,以使所述目標(biāo)神經(jīng)網(wǎng)絡(luò)按照所述目標(biāo)層級(jí)分類樹中所包含的分類特征對(duì)所述待處理圖像進(jìn)行分類識(shí)別,得到識(shí)別結(jié)果。本發(fā)明緩解了現(xiàn)有的寵物圖像識(shí)別技術(shù)只能應(yīng)用于特定的限制場景,無法獲取更全面或更深度的寵物屬性信息,難以在實(shí)際應(yīng)用中發(fā)揮作用的技術(shù)問題。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)字圖像處理的技術(shù)領(lǐng)域,尤其是涉及一種寵物圖像識(shí)別的方法和裝置。
背景技術(shù)
深度神經(jīng)網(wǎng)絡(luò)是近幾年來比較熱門的一個(gè)研究方向,它從仿生學(xué)的角度模擬人類大腦神經(jīng)的多層計(jì)算架構(gòu)體系,通過表征一些復(fù)雜的模式與函數(shù),在語音識(shí)別及圖像處理領(lǐng)域,取得了接近或超過人類水平的效果。但深度學(xué)習(xí)存在訓(xùn)練困難,計(jì)算量大,訓(xùn)練周期長等缺點(diǎn),而且業(yè)界目前的圖像識(shí)別研究領(lǐng)域主要針對(duì)與人相關(guān)的圖像識(shí)別如人臉識(shí)別及分類,針對(duì)寵物圖像識(shí)別的技術(shù)研究還不多,不能很好的滿足實(shí)際需求。例如,目前寵物識(shí)別主要局限在對(duì)寵物的品種識(shí)別如狗/貓/鳥類/水族,或單品種的分類如針對(duì)狗種類的識(shí)別或針對(duì)貓種類的識(shí)別,目前還沒有跨物種的全品類的寵物識(shí)別方法,以及深入到寵物的血統(tǒng),年齡、性別、體型、毛發(fā)等更多更細(xì)的屬性識(shí)別方法。
針對(duì)上述問題,還未提出有效的解決方案。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種寵物圖像識(shí)別的方法和裝置,以緩解了現(xiàn)有的寵物圖像識(shí)別技術(shù)只能應(yīng)用于特定的限制場景,無法獲取更全面或更深度的待識(shí)別寵物的屬性特征,難以在實(shí)際應(yīng)用中發(fā)揮作用的技術(shù)問題。
第一方面,本發(fā)明實(shí)施例提供了一種寵物圖像識(shí)別的方法,該方法包括:獲取待處理圖像,其中,所述待處理圖像的數(shù)量為多個(gè),且每個(gè)所述待處理圖像中均包括待識(shí)別寵物;調(diào)用預(yù)先構(gòu)建的目標(biāo)神經(jīng)網(wǎng)絡(luò),其中,所述目標(biāo)神經(jīng)網(wǎng)絡(luò)為預(yù)先通過目標(biāo)層級(jí)分類樹的層級(jí)損失函數(shù)構(gòu)建的神經(jīng)網(wǎng)絡(luò);將所述待處理圖像輸入至所述目標(biāo)神經(jīng)網(wǎng)絡(luò)中進(jìn)行識(shí)別,以使所述目標(biāo)神經(jīng)網(wǎng)絡(luò)按照所述目標(biāo)層級(jí)分類樹中所包含的分類特征對(duì)所述待處理圖像進(jìn)行分類識(shí)別,得到識(shí)別結(jié)果,其中,所述識(shí)別結(jié)果為所述待處理圖像中所包含的所述待識(shí)別寵物的種類。
進(jìn)一步地,在獲取待處理圖像之前,所述方法還包括:構(gòu)建所述目標(biāo)層級(jí)分類樹;計(jì)算所述目標(biāo)層級(jí)分類樹的層級(jí)損失函數(shù);基于所述層級(jí)損失函數(shù)構(gòu)建所述目標(biāo)神經(jīng)網(wǎng)絡(luò),其中,所述目標(biāo)神經(jīng)網(wǎng)絡(luò)的損失函數(shù)為所述層級(jí)損失函數(shù)。
進(jìn)一步地,構(gòu)建所述目標(biāo)層級(jí)分類樹包括:確定所述目標(biāo)層級(jí)分類樹的分類屬性,其中,所述分類屬性包括:種類和/或?qū)傩蕴卣鳎龇N類包括:待識(shí)別寵物的品種,所述屬性特征包括以下至少之一:待識(shí)別寵物的血統(tǒng),待識(shí)別寵物的年齡,待識(shí)別寵物的年齡,待識(shí)別寵物的性別,待識(shí)別寵物的體型,待識(shí)別寵物的毛發(fā);基于所述分類屬性,為所述目標(biāo)層級(jí)分類樹的各個(gè)節(jié)點(diǎn)配置對(duì)應(yīng)的類別和/或?qū)?yīng)的屬性特征;在為所述目標(biāo)層級(jí)分類樹的各個(gè)節(jié)點(diǎn)配置對(duì)應(yīng)的類別和/或?qū)?yīng)的屬性特征之后,為每個(gè)所述節(jié)點(diǎn)賦予對(duì)應(yīng)的概率值,以及為每個(gè)所述節(jié)點(diǎn)賦予對(duì)應(yīng)的權(quán)重,從而得到所述目標(biāo)層級(jí)分類樹。
進(jìn)一步地,獲取待處理圖像包括:獲取待處理的原始圖像,其中,所述待處理的原始圖像為包括所述待識(shí)別寵物的圖像;對(duì)所述待處理的原始圖像進(jìn)行預(yù)處理,得到所述待處理圖像,其中,所述預(yù)處理包括:剪裁處理和白化處理。
進(jìn)一步地,在獲取待處理圖像之前,所述方法還包括:獲取訓(xùn)練集圖像;通過所述訓(xùn)練集圖像對(duì)所述目標(biāo)神經(jīng)網(wǎng)絡(luò)的初始網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練得到所述目標(biāo)神經(jīng)網(wǎng)絡(luò)。
進(jìn)一步地,獲取訓(xùn)練集圖像包括:對(duì)所述訓(xùn)練集圖像的原始圖像進(jìn)行預(yù)處理,得到所述訓(xùn)練集圖像,其中,所述預(yù)處理包括:剪裁處理,翻轉(zhuǎn)處理,亮度變化處理,對(duì)比度變化處理,白化處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于波奇(上海)信息科技有限公司,未經(jīng)波奇(上海)信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810323793.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種圖像處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 圖像處理方法、裝置及電子設(shè)備
- 圖像處理方法及裝置、處理器、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種圖像處理方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 圖像變形方法、介質(zhì)、設(shè)備及裝置
- 圖像處理方法、裝置、終端和存儲(chǔ)介質(zhì)
- 圖像拍攝地點(diǎn)獲取方法、裝置、數(shù)據(jù)處理設(shè)備及存儲(chǔ)介質(zhì)
- 一種圖像處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種無人機(jī)圖像的自動(dòng)配準(zhǔn)系統(tǒng)
- 一種圖像處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種識(shí)別神經(jīng)元重建錯(cuò)誤的方法
- 神經(jīng)網(wǎng)絡(luò)訓(xùn)練及目標(biāo)檢測(cè)方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)運(yùn)算方法及相關(guān)裝置
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)訓(xùn)練和部署方法、文本翻譯方法及相關(guān)產(chǎn)品
- 神經(jīng)網(wǎng)絡(luò)生成方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)生成方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的確定方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 性能指標(biāo)確定方法及裝置、系統(tǒng)、電子設(shè)備和存儲(chǔ)介質(zhì)





