[發(fā)明專利]一種圖標(biāo)識(shí)別的方法以及相關(guān)裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201910228432.0 | 申請(qǐng)日: | 2019-03-25 |
| 公開(公告)號(hào): | CN109977859B | 公開(公告)日: | 2022-11-18 |
| 發(fā)明(設(shè)計(jì))人: | 黎偉 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G06V20/40 | 分類號(hào): | G06V20/40;G06V20/62 |
| 代理公司: | 深圳市深佳知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518064 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖標(biāo) 識(shí)別 方法 以及 相關(guān) 裝置 | ||
本申請(qǐng)公開了一種圖標(biāo)識(shí)別的方法,包括:從待檢測(cè)視頻中隨機(jī)獲取P幀待檢測(cè)圖像;對(duì)P幀待檢測(cè)圖像中的待檢測(cè)圖像進(jìn)行邊緣檢測(cè),得到目標(biāo)邊緣檢測(cè)圖集合,目標(biāo)邊緣檢測(cè)圖集合中包括M個(gè)目標(biāo)邊緣檢測(cè)圖,每個(gè)目標(biāo)邊緣檢測(cè)圖是對(duì)P個(gè)邊緣檢測(cè)圖融合后得到的;根據(jù)目標(biāo)邊緣檢測(cè)圖集合確定圖標(biāo)區(qū)域;根據(jù)P幀待檢測(cè)圖像以及圖標(biāo)區(qū)域確定待檢測(cè)視頻中的圖標(biāo);將圖標(biāo)與預(yù)設(shè)圖標(biāo)集合進(jìn)行匹配,獲取待檢測(cè)視頻的圖標(biāo)識(shí)別結(jié)果,其中,預(yù)設(shè)圖標(biāo)集合包括至少一個(gè)預(yù)設(shè)圖標(biāo)。本申請(qǐng)還公開了裝置。本申請(qǐng)利用隨機(jī)采樣能夠增加臺(tái)標(biāo)背景變化的多樣性,達(dá)到更好的采樣效果,適用于對(duì)靜態(tài)臺(tái)標(biāo)以及動(dòng)態(tài)臺(tái)標(biāo)的檢測(cè),從而提升識(shí)別準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及圖像處理領(lǐng)域,尤其涉及一種圖標(biāo)識(shí)別的方法以及相關(guān)裝置。
背景技術(shù)
隨著大量視頻信息涌入人們的現(xiàn)實(shí)生活,視頻臺(tái)標(biāo)檢測(cè)已成為對(duì)視頻來源分析的一個(gè)有效手段。通過視頻的臺(tái)標(biāo)可以相對(duì)容易的確定視頻的發(fā)布者,通過節(jié)目中的臺(tái)標(biāo)能定位到具體的節(jié)目。這些重要語義信息用于提供精確的視頻搜索。此外,通過檢測(cè)視頻節(jié)目中的臺(tái)標(biāo)還可以去除廣告片段,進(jìn)而提高觀賞性。在視頻安全領(lǐng)域,視頻臺(tái)標(biāo)檢測(cè)技術(shù)可以有效的確定視頻來源。
目前,可以采用基于光學(xué)字符識(shí)別(Optical Character Recognition,OCR)的方法對(duì)臺(tái)標(biāo)進(jìn)行檢測(cè)和識(shí)別。在用戶切換節(jié)目的時(shí)候,視頻畫面上會(huì)出現(xiàn)具有文字的臺(tái)標(biāo)。在顯示臺(tái)標(biāo)之前還存在一小段時(shí)間的延遲,在段時(shí)間內(nèi)即可對(duì)臺(tái)標(biāo)進(jìn)行OCR文字識(shí)別,基于文字直接判別臺(tái)標(biāo)類型。
然而,隨著視頻類型的不斷增加,越來越多的臺(tái)標(biāo)涌現(xiàn)出來。這些臺(tái)標(biāo)往往具有一些特殊的效果,比如,A類臺(tái)標(biāo)會(huì)不斷抖動(dòng),B類臺(tái)標(biāo)的字幕漸次滾動(dòng)出現(xiàn)后再消失,并交替出現(xiàn)在視頻的左上角和右下角,C類臺(tái)標(biāo)的圖像和文字都會(huì)不斷旋轉(zhuǎn)等等。這些類型的臺(tái)標(biāo)隨時(shí)間變化而發(fā)生變化,也可以稱為動(dòng)圖臺(tái)標(biāo)。基于OCR的方法對(duì)動(dòng)圖臺(tái)標(biāo)進(jìn)行識(shí)別,其準(zhǔn)確率較低,且不適用于純圖像的動(dòng)態(tài)臺(tái)標(biāo),導(dǎo)致適應(yīng)范圍較小。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種圖標(biāo)識(shí)別的方法以及相關(guān)裝置,一方面利用隨機(jī)采樣能夠增加臺(tái)標(biāo)背景變化的多樣性,達(dá)到更好的采樣效果,另一方面,將多幀視頻圖像進(jìn)行融合能夠?qū)?dòng)態(tài)臺(tái)標(biāo)變?yōu)橄鄬?duì)穩(wěn)定的靜態(tài)臺(tái)標(biāo),進(jìn)而對(duì)靜態(tài)臺(tái)標(biāo)進(jìn)行識(shí)別,由此適用于對(duì)靜態(tài)臺(tái)標(biāo)以及動(dòng)態(tài)臺(tái)標(biāo)的檢測(cè),從而提升識(shí)別準(zhǔn)確率。
有鑒于此,本申請(qǐng)第一方面提供一種圖標(biāo)識(shí)別的方法,包括:
從待檢測(cè)視頻中隨機(jī)獲取P幀待檢測(cè)圖像,其中,所述待檢測(cè)視頻包括Q幀視頻圖像,所述Q為大于1的整數(shù),所述P為大于或等于1,且小于或等于所述Q的整數(shù);
對(duì)所述P幀待檢測(cè)圖像中的待檢測(cè)圖像進(jìn)行邊緣檢測(cè),得到目標(biāo)邊緣檢測(cè)圖集合,其中,所述目標(biāo)邊緣檢測(cè)圖集合中包括M個(gè)目標(biāo)邊緣檢測(cè)圖,每個(gè)目標(biāo)邊緣檢測(cè)圖是對(duì)P個(gè)邊緣檢測(cè)圖融合后得到的,所述M為大于或等于1的整數(shù);
根據(jù)所述目標(biāo)邊緣檢測(cè)圖集合確定圖標(biāo)區(qū)域;
根據(jù)所述P幀待檢測(cè)圖像以及所述圖標(biāo)區(qū)域確定所述待檢測(cè)視頻中的圖標(biāo);
將所述圖標(biāo)與預(yù)設(shè)圖標(biāo)集合進(jìn)行匹配,獲取所述待檢測(cè)視頻的圖標(biāo)識(shí)別結(jié)果,其中,所述預(yù)設(shè)圖標(biāo)集合包括至少一個(gè)預(yù)設(shè)圖標(biāo)。
本申請(qǐng)第二方面提供一種圖標(biāo)識(shí)別裝置,包括:
獲取模塊,用于從待檢測(cè)視頻中隨機(jī)獲取P幀待檢測(cè)圖像,其中,所述待檢測(cè)視頻包括Q幀視頻圖像,所述Q為大于1的整數(shù),所述P為大于或等于1,且小于或等于所述Q的整數(shù);
檢測(cè)模塊,用于對(duì)所述獲取模塊獲取的所述P幀待檢測(cè)圖像中的待檢測(cè)圖像進(jìn)行邊緣檢測(cè),得到目標(biāo)邊緣檢測(cè)圖集合,其中,所述目標(biāo)邊緣檢測(cè)圖集合中包括M個(gè)目標(biāo)邊緣檢測(cè)圖,每個(gè)目標(biāo)邊緣檢測(cè)圖是對(duì)P個(gè)邊緣檢測(cè)圖融合后得到的,所述M為大于或等于1的整數(shù);
確定模塊,用于根據(jù)所述檢測(cè)模塊檢測(cè)得到的所述目標(biāo)邊緣檢測(cè)圖集合確定臺(tái)標(biāo)區(qū)域;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910228432.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 接收裝置以及接收方法、以及程序
- 凈水濾芯以及凈水裝置、以及洗漱臺(tái)
- 隱匿檢索系統(tǒng)以及公開參數(shù)生成裝置以及加密裝置以及用戶秘密密鑰生成裝置以及查詢發(fā)布裝置以及檢索裝置以及計(jì)算機(jī)程序以及隱匿檢索方法以及公開參數(shù)生成方法以及加密方法以及用戶秘密密鑰生成方法以及查詢發(fā)布方法以及檢索方法
- 編碼方法以及裝置、解碼方法以及裝置
- 編碼方法以及裝置、解碼方法以及裝置
- 圖片顯示方法以及裝置以及移動(dòng)終端
- ENB以及UEUL發(fā)送以及接收的方法
- X射線探測(cè)方法以及裝置以及系統(tǒng)
- 圖書信息錄入方法以及系統(tǒng)以及書架
- 護(hù)耳器以及口罩以及眼鏡





