[發(fā)明專利]視頻標簽生成方法、裝置及電子終端在審
| 申請?zhí)枺?/td> | 201911277514.0 | 申請日: | 2019-12-11 |
| 公開(公告)號: | CN112948631A | 公開(公告)日: | 2021-06-11 |
| 發(fā)明(設(shè)計)人: | 張海斌;陳熊;汪賢;樊鴻飛 | 申請(專利權(quán))人: | 北京金山云網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號: | G06F16/75 | 分類號: | G06F16/75;G06F16/783;G06N3/04 |
| 代理公司: | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 11463 | 代理人: | 徐彥圣 |
| 地址: | 100000 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視頻 標簽 生成 方法 裝置 電子 終端 | ||
本發(fā)明提供了一種視頻標簽生成方法、裝置及電子終端,涉及視頻處理技術(shù)領(lǐng)域,該方法通過利用一級神經(jīng)網(wǎng)絡(luò)模型對視頻文件進行識別,確定視頻文件的一級視頻標簽,然后對生成的一級視頻標簽進行分類,得到第一標簽的所述類別,根據(jù)一級視頻標簽的所屬類別,利用對應(yīng)的二級神經(jīng)網(wǎng)絡(luò)模型對視頻文件進行識別,生成視頻文件的二級視頻標簽。其中,二級視頻標簽的所屬類別是一級視頻標簽的所屬類別的子類別。該方法對視頻中的標簽集合進行了分類,再根據(jù)分類結(jié)果完成標簽預(yù)測,實現(xiàn)了每一級視頻標簽的預(yù)測只考慮該標簽下的子標簽的集合,大幅度減少待預(yù)測標簽集合的大小,提高標簽預(yù)測的準確性。
技術(shù)領(lǐng)域
本發(fā)明涉及視頻處理技術(shù)領(lǐng)域,尤其是涉及一種視頻標簽生成方法、裝置及電子終端。
背景技術(shù)
視頻標簽作為描述視頻的特征和類型,可將視頻進行層次化分類,通常用于視頻檢索和視頻推薦。視頻標簽的獲取是通過對視頻進行場景分類、人物識別、語音識別、文字識別等多維度分析,形成層次化分類標簽的過程。現(xiàn)有技術(shù)對同一層次的標簽作為集合進行標簽分類的過程中,當標簽數(shù)量較多時,預(yù)測的速度以及精度會降低。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種視頻標簽生成方法、裝置及電子終端,通過減少標簽分類時待預(yù)測標簽集合的大小,提高了標簽預(yù)測的準確性。
第一方面,本發(fā)明實施例提供的一種視頻標簽生成方法,該方法包括:
利用一級神經(jīng)網(wǎng)絡(luò)模型對視頻文件進行識別,確定視頻文件的一級視頻標簽;
根據(jù)一級視頻標簽的所屬類別,利用對應(yīng)的二級神經(jīng)網(wǎng)絡(luò)模型對視頻文件進行識別,生成視頻文件的二級視頻標簽;
其中,二級視頻標簽的所屬類別是一級視頻標簽的所屬類別的子類別。
進一步的,上述利用一級神經(jīng)網(wǎng)絡(luò)模型對視頻文件進行識別,確定視頻文件的一級視頻標簽的步驟,包括:
將視頻文件輸入一級三維卷積層,對視頻文件進行三維卷積處理,獲得經(jīng)三維卷積處理后的視頻文件;
將經(jīng)三維卷積處理后的視頻文件輸入連續(xù)的若干個階段的卷積層,對視頻文件進行卷積處理,獲得經(jīng)卷積處理后的視頻文件;
將經(jīng)卷積處理后的視頻文件輸入全連接層,對視頻文件進行全連接操作,經(jīng)過softmax函數(shù)輸出一級視頻標簽。
進一步的,每個階段的卷積層包括若干個瓶頸層或密集塊層。
進一步的,上述根據(jù)一級視頻標簽的所屬類別,利用對應(yīng)的二級神經(jīng)網(wǎng)絡(luò)模型對視頻文件進行識別,生成視頻文件的二級視頻標簽的步驟,包括:
根據(jù)一級視頻標簽的所屬類別,選擇對應(yīng)的二級神經(jīng)網(wǎng)絡(luò)模型;
將視頻文件輸入二級三維卷積層,對視頻文件進行三維卷積處理,獲得經(jīng)三維卷積處理后的視頻文件;
將經(jīng)三維卷積處理后的視頻文件輸入連續(xù)的若干個階段的卷積層,對視頻文件進行卷積處理,獲得經(jīng)卷積處理后的視頻文件;
將經(jīng)卷積處理后的視頻文件輸入全連接層,對視頻文件進行全連接操作,經(jīng)過softmax函數(shù)輸出二級視頻標簽。
進一步的,一級視頻標簽包括CG視頻和非CG視頻。
進一步的,上述二級視頻標簽包括屬于CG視頻的子類別的游戲、動漫,以及屬于非CG視頻的子類別的體育、秀場、綜藝。
進一步的,上述方法還包括:
根據(jù)二級視頻標簽的類別,利用對應(yīng)的三級神經(jīng)網(wǎng)絡(luò)模型對視頻文件進行識別,生成視頻文件的三級視頻標簽;
其中,三級視頻標簽的所屬類別是二級視頻標簽的所屬類別的子類別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京金山云網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)北京金山云網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911277514.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





