[發(fā)明專利]視頻畫面中對(duì)象的信息的獲取方法、裝置及設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 201911409025.6 | 申請(qǐng)日: | 2019-12-31 |
| 公開(公告)號(hào): | CN111147891B | 公開(公告)日: | 2022-09-13 |
| 發(fā)明(設(shè)計(jì))人: | 肖丁 | 申請(qǐng)(專利權(quán))人: | 杭州威佩網(wǎng)絡(luò)科技有限公司 |
| 主分類號(hào): | H04N21/234 | 分類號(hào): | H04N21/234;H04N21/44;G06V20/40;G06K9/62 |
| 代理公司: | 北京柏杉松知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11413 | 代理人: | 孫翠賢;丁蕓 |
| 地址: | 310012 浙江省杭州市*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視頻 畫面 對(duì)象 信息 獲取 方法 裝置 設(shè)備 | ||
本發(fā)明實(shí)施例提供的一種視頻畫面中對(duì)象的信息的獲取方法、裝置及設(shè)備,獲取視頻中的視頻幀以及所述視頻幀的畫面類型;所述畫面類型包括:待識(shí)別對(duì)象為文字對(duì)象的文字類型,以及待識(shí)別對(duì)象為人物對(duì)象的人物類型;利用與所述畫面類型對(duì)應(yīng)的識(shí)別模型,從所述視頻幀中識(shí)別與所述畫面類型對(duì)應(yīng)的預(yù)存對(duì)象信息匹配的內(nèi)容,作為所述視頻幀的對(duì)象信息;基于所述視頻中各視頻幀的對(duì)象信息,獲得所述視頻的視頻畫面中對(duì)象的信息。通過本方案,可以自動(dòng)獲取視頻畫面中對(duì)象的信息。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識(shí)別技術(shù)領(lǐng)域,特別是涉及一種視頻畫面中對(duì)象的信息的獲取方法、裝置及設(shè)備。
背景技術(shù)
隨著視頻技術(shù)的發(fā)展,視頻畫面呈現(xiàn)的內(nèi)容可以包括多樣化的對(duì)象,例如,文字形式的內(nèi)容:文字對(duì)象;人像形式的內(nèi)容:人物對(duì)象等等。并且,示例性的,視頻畫面中文字對(duì)象的對(duì)象信息具體可以包括:影視劇中的演職人員名稱和角色名稱,比賽視頻中比賽選手的名稱等等;人物對(duì)象的對(duì)象信息具體可以包括:影視劇中的人像代表的演員名稱、角色名稱以及演員作品等等,比賽視頻中的人像代表的參賽選手名稱、所在陣營(yíng)以及國(guó)籍等等信息。
對(duì)此,為了使視頻的觀眾以及視頻評(píng)價(jià)平臺(tái)等等存在視頻畫面中對(duì)象的信息獲取需求的主體,能夠直觀以及快速地了解視頻畫面中對(duì)象的信息,需要自動(dòng)獲取視頻畫面中對(duì)象的信息。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種視頻畫面中對(duì)象的信息的獲取方法、裝置及設(shè)備,以實(shí)現(xiàn)自動(dòng)獲取視頻畫面中對(duì)象的信息的效果。具體技術(shù)方案如下:
第一方面,本發(fā)明實(shí)施例提供了一種視頻畫面中對(duì)象的信息的獲取方法,該方法包括:
獲取視頻中的視頻幀以及所述視頻幀的畫面類型;所述畫面類型包括:待識(shí)別對(duì)象為文字對(duì)象的文字類型,以及待識(shí)別對(duì)象為人物對(duì)象的人物類型;
利用與所述畫面類型對(duì)應(yīng)的識(shí)別模型,從所述視頻幀中識(shí)別與所述畫面類型對(duì)應(yīng)的預(yù)存對(duì)象信息匹配的內(nèi)容,作為所述視頻幀的對(duì)象信息;
基于所述視頻中各視頻幀的對(duì)象信息,獲得所述視頻的視頻畫面中對(duì)象的信息。
可選的,所述獲取視頻中視頻幀的畫面類型,包括:
獲取所述視頻幀的時(shí)間戳;所述時(shí)間戳用于表明所述視頻幀在所述視頻中的播放時(shí)間點(diǎn);
從所述視頻對(duì)應(yīng)的預(yù)存的時(shí)間戳與畫面類型的對(duì)應(yīng)關(guān)系中,查找所述視頻幀的時(shí)間戳對(duì)應(yīng)的畫面類型,作為所述視頻幀的畫面類型。
可選的,與所述文字類型對(duì)應(yīng)的預(yù)存對(duì)象信息包括:預(yù)存的人物名稱信息;
所述利用與所述畫面類型對(duì)應(yīng)的識(shí)別模型,從所述視頻幀中識(shí)別與所述畫面類型對(duì)應(yīng)的預(yù)存對(duì)象信息匹配的內(nèi)容,作為所述視頻幀的對(duì)象信息,包括:
獲取所述文字類型的視頻幀中第一指定區(qū)域的圖像,作為第一待檢圖像;
利用預(yù)先訓(xùn)練得到的第一神經(jīng)網(wǎng)絡(luò)模型,對(duì)所述第一待檢圖像進(jìn)行文本檢測(cè),得到所述第一待檢圖像中存在文字信息的文字區(qū)域,并將所得到的文字區(qū)域作為待識(shí)別圖像;其中,所述第一神經(jīng)網(wǎng)絡(luò)模型為利用第一樣本圖像和所述第一樣本圖像中文字區(qū)域的標(biāo)注框訓(xùn)練得到的;
利用預(yù)先訓(xùn)練得到的第二神經(jīng)網(wǎng)絡(luò)模型,對(duì)所述待識(shí)別圖像進(jìn)行文本識(shí)別,得到所述待識(shí)別圖像中的文字信息;其中,所述第二神經(jīng)網(wǎng)絡(luò)模型為利用第二樣本圖像和所述第二樣本圖像中的人物名稱信息訓(xùn)練得到的;所述第二樣本圖像為存在所述預(yù)存的人物名稱信息的圖像;
將所得到的文字信息作為所述視頻幀的對(duì)象信息。
可選的,所述第一待檢圖像中存在文字信息的文字區(qū)域的數(shù)量為多個(gè);
所述將所得到的文字區(qū)域作為待識(shí)別圖像,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州威佩網(wǎng)絡(luò)科技有限公司,未經(jīng)杭州威佩網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911409025.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點(diǎn)播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機(jī)頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠(yuǎn)程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨(dú)立于分配過程實(shí)現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件
- 對(duì)象選擇裝置、對(duì)象選擇程序及對(duì)象選擇方法
- 對(duì)象顯示裝置、對(duì)象顯示系統(tǒng)以及對(duì)象顯示方法
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象分析方法、對(duì)象分析設(shè)備及對(duì)象分析系統(tǒng)
- 對(duì)象索引方法、對(duì)象搜索方法及對(duì)象索引系統(tǒng)
- 對(duì)象分類方法和對(duì)象分類設(shè)備
- 對(duì)象庫(kù)中的對(duì)象簽名
- 對(duì)象追蹤方法、對(duì)象追蹤系統(tǒng)以及對(duì)象追蹤程序
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





