[發明專利]多媒體資源的處理方法、裝置、電子設備及存儲介質在審
| 申請號: | 202010847843.0 | 申請日: | 2020-08-21 |
| 公開(公告)號: | CN112000817A | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 張志偉;楊帆 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G06F16/43 | 分類號: | G06F16/43;G06F16/48;G06K9/62 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 仝麗 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多媒體 資源 處理 方法 裝置 電子設備 存儲 介質 | ||
本公開關于一種多媒體資源的處理方法、裝置、電子設備及存儲介質,通過獲取多媒體資源對應的詞組合;并獲取詞組合中各詞語的預測概率和各詞語的信息域特征;且預測概率為識別到各詞語的概率,信息域特征用于表征詞語的來源途徑;為了更準確地表達每個詞語的特征,針對每個詞語,將對應的預測概率和對應的信息域特征進行合并,得到各詞語的融合特征;從而根據各詞語的融合特征,對各詞語的詞權重進行預估,并按照預估的詞權重大小對各詞語進行排序,得到排序后的詞組合。結合多媒體資源對應的詞組合中各個詞語的重要性進行多媒體資源搜索或者多媒體資源推薦,可以高效、精準地為用戶提供多媒體資源。
技術領域
本公開涉及計算機技術領域,尤其涉及一種多媒體資源的處理方法、裝置、電子設備及存儲介質。
背景技術
隨著機器學習領域的發展,深度學習在視頻圖像、語音識別、自然語言處理等相關領域得到了廣泛應用。卷積神經網絡(Convolutional Neural Networks,CNN)作為深度學習的一個重要分支,由于其超強的擬合能力以及端到端的全局優化能力,在應用卷積神經網絡之后圖像分類模型對視頻文件的預測精度得到大幅提升。
相關技術中,通過圖像分類模型、自然語言處理算法、語音識別算法等對視頻文件進行感知,可以得到視頻文件在這些信息域上的文本數據。利用這些信息域上的文本數據可以生成視頻文件的視頻標簽。
然而,在實際業務場景中,比如在視頻搜索時,通過傳統技術中的視頻標簽搜索得到的視頻文件與用戶期望之間的匹配度并不高。
發明內容
本公開提供一種多媒體資源的處理方法、裝置、電子設備及存儲介質,以至少解決相關技術中通過視頻標簽搜索得到的視頻文件與用戶期望之間的匹配度不高的問題。本公開的技術方案如下:
根據本公開實施例的第一方面,提供一種多媒體資源的處理方法,包括:
獲取多媒體資源對應的詞組合,所述詞組合包括若干個詞語;
獲取各所述詞語的預測概率和各所述詞語的信息域特征;其中,所述預測概率為對所述多媒體資源進行識別得到各所述詞語的概率,所述信息域特征用于表征詞語的來源途徑;
針對每個所述詞語,將對應的所述預測概率和對應的所述信息域特征進行合并,得到各所述詞語的融合特征;
根據所述各所述詞語的融合特征,對各所述詞語的詞權重進行預估,并按照預估的詞權重大小對各所述詞語進行排序,得到排序后的詞組合。
在其中一個實施例中,所述多媒體資源對應的詞組合的生成方式,包括:
獲取所述多媒體資源對應的文本信息,所述文本信息的格式包括文檔格式和標簽格式;
對文檔格式的文本信息進行分詞處理,得到所述文檔格式的文本信息對應的詞語;
根據所述文檔格式的文本信息對應的詞語和標簽格式的文本信息,生成所述多媒體資源對應的詞組合。
在其中一個實施例中,所述根據所述文檔格式的文本信息對應的詞組合和標簽格式的文本信息,生成所述多媒體資源對應的詞組合,包括:
對所述文檔格式的文本信息對應的詞語和所述標簽格式的文本信息進行融合和去重處理,得到所述多媒體資源對應的詞組合。
在其中一個實施例中,所述獲取各所述詞語的預測概率和各所述詞語的信息域特征,包括:
對各所述多媒體資源進行詞語識別,得到從所述多媒體資源中識別出各所述詞語的預測概率;
對各所述詞語的來源途徑對應的信息域進行數值表示,得到各所述詞語的信息域特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010847843.0/2.html,轉載請聲明來源鉆瓜專利網。





