[發(fā)明專利]一種確定對象類別的方法、裝置、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201911258081.4 | 申請日: | 2019-12-10 |
| 公開(公告)號: | CN111046944A | 公開(公告)日: | 2020-04-21 |
| 發(fā)明(設(shè)計)人: | 張橋松;林佳月;文為 | 申請(專利權(quán))人: | 北京奇藝世紀(jì)科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京柏杉松知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11413 | 代理人: | 馬敬;項(xiàng)京 |
| 地址: | 100080 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 確定 對象 類別 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明實(shí)施例提供了一種確定對象類別的方法、裝置、電子設(shè)備及存儲介質(zhì),可以獲取待識別圖像,基于預(yù)先訓(xùn)練的類別預(yù)測網(wǎng)絡(luò)模型,確定待識別圖像中顯示的對象的類別,作為第一類別,針對每一對象,基于預(yù)先訓(xùn)練的與該對象的第一類別相對應(yīng)的子類別預(yù)測網(wǎng)絡(luò)模型,確定該對象的子類別,作為第一子類別。基于上述處理,針對待識別圖像中顯示的每一對象,在確定該對象的類別之后,可以基于與該對象的類別對應(yīng)的子類別預(yù)測網(wǎng)絡(luò)模型,確定該對象的子類別,進(jìn)而,能夠確定同一類別的對象的子類別,可以提高確定對象類別的方法的適用范圍。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,特別是涉及一種確定對象類別的方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
隨著計算機(jī)技術(shù)的發(fā)展,用于多目標(biāo)識別的APP(Application,應(yīng)用程序)逐漸增多。用于多目標(biāo)識別的APP,可以基于圖像識別,確定一張圖像中顯示的多個對象各自的類別。
現(xiàn)有技術(shù)中,確定一張圖像中顯示的多個對象各自的類別的方法,包括以下步驟:將待識別圖像輸入至預(yù)先訓(xùn)練的類別預(yù)測網(wǎng)絡(luò)模型中,然后,類別預(yù)測網(wǎng)絡(luò)模型可以輸出該圖像中顯示的多個對象各自的類別,并對多個對象進(jìn)行類別標(biāo)記。例如,將一張顯示有車、狗和椅子的圖像輸入類別預(yù)測網(wǎng)絡(luò)模型,類別預(yù)測網(wǎng)絡(luò)模型可以確定該圖像中顯示的對象的類別包括:車、狗、椅子。
然而,實(shí)際應(yīng)用中,可能需要對一張圖像中顯示的屬于同一類別的對象的子類別進(jìn)行區(qū)分,例如,確定一張圖像中顯示的鳥群中的每一只鳥的子類別。現(xiàn)有技術(shù)中,并未提供相應(yīng)的方法,能夠確定同一類別的對象的子類別,導(dǎo)致現(xiàn)有技術(shù)中確定對象類別的方法的適用范圍較窄。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種確定對象類別的方法、裝置、電子設(shè)備及存儲介質(zhì),能夠確定同一類別的對象的子類別,可以提高確定對象類別的方法的適用范圍。具體技術(shù)方案如下:
在本發(fā)明實(shí)施的第一方面,首先提供了一種確定對象類別的方法,所述方法包括:
獲取待識別圖像;
基于預(yù)先訓(xùn)練的類別預(yù)測網(wǎng)絡(luò)模型,確定所述待識別圖像中顯示的對象的類別,作為第一類別,其中,所述類別預(yù)測網(wǎng)絡(luò)模型為基于第一訓(xùn)練樣本得到的,所述第一訓(xùn)練樣本包括第一樣本圖像和所述第一樣本圖像中顯示的對象的位置和類別;
針對每一所述對象,基于預(yù)先訓(xùn)練的與該對象的第一類別相對應(yīng)的子類別預(yù)測網(wǎng)絡(luò)模型,確定該對象的子類別,作為第一子類別,其中,所述第一子類別屬于所述第一類別,所述子類別預(yù)測網(wǎng)絡(luò)模型為基于第二訓(xùn)練樣本得到的,所述第二訓(xùn)練樣本包括第二樣本圖像和所述第二樣本圖像中顯示的對象的子類別,所述第二樣本圖像中僅顯示有一個對象,所述第二樣本圖像中顯示的對象的子類別屬于所述第一類別。
可選的,所述基于預(yù)先訓(xùn)練的類別預(yù)測網(wǎng)絡(luò)模型,確定所述待識別圖像中顯示的對象的類別,包括:
如果所述待識別圖像的亮度小于第一亮度閾值,將所述待識別圖像的亮度提高至目標(biāo)亮度范圍,得到第一圖像,其中,所述目標(biāo)亮度范圍的下限值不小于所述第一亮度閾值,所述目標(biāo)亮度范圍的上限值為預(yù)設(shè)亮度閾值,所述預(yù)設(shè)亮度閾值大于所述第一亮度閾值;
基于預(yù)先訓(xùn)練的類別預(yù)測網(wǎng)絡(luò)模型,確定所述第一圖像中顯示的對象的類別,作為所述待識別圖像中顯示的對象的類別。
可選的,在所述基于預(yù)先訓(xùn)練的該對象的第一類別對應(yīng)的子類別預(yù)測網(wǎng)絡(luò)模型,確定該對象的子類別之前,所述方法還包括:
針對每一所述對象,從所述待識別圖像中提取該對象所占區(qū)域的最小外接矩形對應(yīng)的圖像,作為目標(biāo)圖像;
所述基于預(yù)先訓(xùn)練的該對象的第一類別對應(yīng)的子類別預(yù)測網(wǎng)絡(luò)模型,確定該對象的子類別,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇藝世紀(jì)科技有限公司,未經(jīng)北京奇藝世紀(jì)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911258081.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





