[發(fā)明專利]視頻標(biāo)簽獲取方法、裝置、電子設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202210291768.3 | 申請日: | 2022-03-22 |
| 公開(公告)號: | CN114756710A | 公開(公告)日: | 2022-07-15 |
| 發(fā)明(設(shè)計)人: | 翟步中;唐大閏 | 申請(專利權(quán))人: | 北京明略昭輝科技有限公司 |
| 主分類號: | G06F16/78 | 分類號: | G06F16/78;G06N3/04;G06F16/75;G06N3/08;G06F16/783 |
| 代理公司: | 北京華夏泰和知識產(chǎn)權(quán)代理有限公司 11662 | 代理人: | 蔡良偉 |
| 地址: | 100098 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視頻 標(biāo)簽 獲取 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明公開了一種視頻標(biāo)簽獲取方法、裝置、電子設(shè)備和存儲介質(zhì)。其中,方法包括獲取目標(biāo)視頻的多幀圖片;將所述多幀圖片輸入至訓(xùn)練好的網(wǎng)絡(luò)模型中,獲取所述目標(biāo)視頻的標(biāo)簽;其中,所述網(wǎng)絡(luò)模型根據(jù)所述目標(biāo)視頻多幀圖片中物體圖結(jié)構(gòu)的變換獲得所述目標(biāo)視頻的標(biāo)簽。采用本發(fā)明提供的方案能基于視頻中物體的變化獲取視頻的標(biāo)簽,實用性強,準(zhǔn)確率高。
技術(shù)領(lǐng)域
本發(fā)明涉及視頻標(biāo)簽技術(shù)領(lǐng)域,尤其涉及一種視頻標(biāo)簽獲取方法、裝置、電子設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)的飛速發(fā)展,使得用戶可以通過各種終端的視頻類應(yīng)用程序或網(wǎng)站獲取各種類型的視頻,例如電影、電視劇等。對于視頻來說,視頻標(biāo)簽?zāi)軌蚝芎玫恼故疽曨l的類型、特色等,從而用戶可以根據(jù)視頻標(biāo)簽選擇自己喜愛的視頻類型,大大提升了用戶的使用體驗。
但目前,視頻標(biāo)簽一般操作人員通過觀看視頻內(nèi)容,基于經(jīng)驗獲取視頻的標(biāo)簽,從而進(jìn)行打標(biāo)簽操作。但上述方式需要大量的人工成本,且由于操作人員的標(biāo)準(zhǔn)不一致,準(zhǔn)確率不高。
發(fā)明內(nèi)容
為解決現(xiàn)有的視頻標(biāo)簽獲取過程難,準(zhǔn)確率低的相關(guān)技術(shù)問題,本發(fā)明實施例提供一種視頻標(biāo)簽獲取方法、裝置、電子設(shè)備和存儲介質(zhì)。
本發(fā)明實施例的技術(shù)方案是這樣實現(xiàn)的:
本發(fā)明實施例提供了一種視頻標(biāo)簽獲取方法,方法包括:
獲取目標(biāo)視頻的多幀圖片;
將所述多幀圖片輸入至訓(xùn)練好的網(wǎng)絡(luò)模型中,獲取所述目標(biāo)視頻的標(biāo)簽;其中,所述網(wǎng)絡(luò)模型根據(jù)所述目標(biāo)視頻多幀圖片中物體圖結(jié)構(gòu)的變換獲得所述目標(biāo)視頻的標(biāo)簽。
上述方案中,所述網(wǎng)絡(luò)模型為多個,所述將所述多幀圖片輸入至訓(xùn)練好的網(wǎng)絡(luò)模型中,獲取所述目標(biāo)視頻的標(biāo)簽包括:
將所述多幀圖片輸入到多個網(wǎng)絡(luò)模型中的每個網(wǎng)絡(luò)模型中,獲取每個網(wǎng)絡(luò)模型針對所述多幀圖片所輸出的標(biāo)簽結(jié)果;
將多個標(biāo)簽結(jié)果作為所述目標(biāo)視頻的標(biāo)簽。
上述方案中,所述將所述多幀圖片輸入到多個網(wǎng)絡(luò)模型中的每個網(wǎng)絡(luò)模型中,獲取每個網(wǎng)絡(luò)模型針對所述多幀圖片所輸出的標(biāo)簽結(jié)果包括:
對所述多幀圖片中的每幀圖片進(jìn)行物體檢測識別,構(gòu)建每幀圖片的物體圖結(jié)構(gòu);
將所述多幀圖片中每幀圖片對應(yīng)的物體圖結(jié)構(gòu)輸入至多個網(wǎng)絡(luò)模型中的每個網(wǎng)絡(luò)模型中,獲取每個網(wǎng)絡(luò)模型針對所述多幀圖片所輸出的標(biāo)簽結(jié)果。
上述方案中,所述對所述多幀圖片中的每幀圖片進(jìn)行物體檢測識別,構(gòu)建每幀圖片的物體圖結(jié)構(gòu)包括:
對所述多幀圖片中的每幀圖片進(jìn)行物體檢測識別,確定每幀圖片中每一物體的物體位置和物體類型;
基于所述每幀圖片中每一物體的物體位置和物體類型,構(gòu)建每幀圖片內(nèi)物體間的關(guān)系圖;
將構(gòu)建后的每幀圖片的物體間的關(guān)系圖確定為每幀圖片的物體圖結(jié)構(gòu)。
上述方案中,所述網(wǎng)絡(luò)模型的訓(xùn)練過程包括:
獲取訓(xùn)練圖片集;
對所述訓(xùn)練圖片集中的每幀圖片進(jìn)行物體檢測識別,確定所述訓(xùn)練圖片集中的每幀圖片的物體圖結(jié)構(gòu);
以所述訓(xùn)練圖片集中的出現(xiàn)次數(shù)最多的物體為中心節(jié)點;將所述訓(xùn)練圖片集中的每幀圖片的物體圖結(jié)構(gòu)輸入至預(yù)設(shè)的網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,獲得訓(xùn)練好的網(wǎng)絡(luò)模型;其中,中心節(jié)點不同,基于不同的中心節(jié)點根據(jù)物體圖結(jié)構(gòu)的變換訓(xùn)練獲得的網(wǎng)絡(luò)模型輸出的標(biāo)簽結(jié)果不同。
上述方案中,所述獲取目標(biāo)視頻的多幀圖片包括:
獲取目標(biāo)視頻;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京明略昭輝科技有限公司,未經(jīng)北京明略昭輝科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210291768.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





