[發明專利]多媒體文件的預測方法和裝置有效
| 申請號: | 201711409084.4 | 申請日: | 2017-12-22 |
| 公開(公告)號: | CN108304459B | 公開(公告)日: | 2019-03-12 |
| 發明(設計)人: | 張志偉;楊帆 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G06F16/44 | 分類號: | G06F16/44 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標多媒體文件 多媒體文件 分布概率 圖像識別算法 語音識別算法 自然語言處理 方法和裝置 內容識別 算法 預測 標簽 目標主題 主題集 預設 排序 統計 | ||
本發明提供了一種多媒體文件的預測方法和裝置,其中,所述方法包括:對目標多媒體文件集分別通過語音識別算法、圖像識別算法及自然語言處理算法,識別得到三個標簽集;根據三個標簽集,將目標多媒體文件集中的各目標多媒體文件劃分至預設主題集的各主題中,并統計各目標多媒體文件在各主題中的分布概率;根據各目標多媒體文件在各主題中的分布概率及各主題中目標主題對應的條件分布概率,預測各目標多媒體文件的得分;按照得分對各目標多媒體文件進行排序。從而可以解決單獨采用語音識別算法、圖像識別算法或自然語言處理算法進行內容識別,準確性較差的問題,取得了提高多媒體文件內容識別的準確性的有益效果。
技術領域
本發明涉及軟件應用技術領域,尤其涉及一種多媒體文件的預測方法和裝置。
背景技術
近年來,深度學習在視頻圖像、語音識別、自然語言處理等領域得到了廣泛應用。例如,對于視頻圖像而言,采用圖像識別算法進行內容識別;對于語音數據,采用語音識別算法進行內容識別;對于文本數據,采用自然語音處理進行內容識別。
而在實際應用中,單獨采用一種算法進行識別,往往無法準確的識別內容。例如,對于典型的UGC平臺(User Generated Content,用戶原創內容平臺),每天均會有大量用戶上傳各種各樣的視頻,這些記錄用戶生活的視頻包括自拍、跳舞、美食等內容。當要從數以億計的視頻中篩選出“美食教程”的視頻時,若僅采用圖像分類算法,雖然可以識別出“美食”視頻,但無法識別出“教程”視頻;若使用自然語言處理算法,雖然可以從文本中分離出“教程”以識別出“教程”視頻,但無法識別圖像中的“美食”;若把這個兩個算法簡單聯合起來,雖然可以篩選出一定的“美食教程”視頻,但并不是所有“美食教程”視頻都包括“教程”字樣,用戶描述視頻的文字很可能是“蔥”、“姜”、“蒜”等食材。從而僅靠簡單的算法融合無法準確識別內容。
發明內容
本發明實施例提供的多媒體文件的預測方法和裝置,可解決單獨采用語音識別算法、圖像識別算法或自然語言處理算法進行內容識別,準確性較差的問題。
一方面,本發明實施例公開了一種多媒體文件的預測方法,包括:
對目標多媒體文件集分別通過語音識別算法、圖像識別算法及自然語言處理算法,識別得到第一標簽集、第二標簽集及第三標簽集;
根據所述第一標簽集、第二標簽集及第三標簽集,將所述目標多媒體文件集中的各目標多媒體文件劃分至預設主題集的各主題中,并統計所述各目標多媒體文件在各主題中的分布概率;
根據所述各目標多媒體文件在各主題中的分布概率以及各主題中目標主題對應的條件分布概率,預測所述各目標多媒體文件的得分;所述條件分布概率通過對訓練多媒體文件集進行訓練得到;
按照所述得分對所述各目標多媒體文件進行排序。
另一方面,本發明實施例還公開了一種多媒體文件的預測裝置,包括:
標簽獲取模塊,用于對目標多媒體文件集分別通過語音識別算法、圖像識別算法及自然語言處理算法,識別得到第一標簽集、第二標簽集及第三標簽集;
主題劃分模塊,用于根據所述第一標簽集、第二標簽集及第三標簽集,將所述目標多媒體文件集中的各目標多媒體文件劃分至預設主題集的各主題中,并統計所述各目標多媒體文件在各主題中的分布概率;
得分預測模塊,用于根據所述各目標多媒體文件在各主題中的分布概率以及各主題中目標主題對應的條件分布概率,預測所述各目標多媒體文件的得分;所述條件分布概率通過對訓練多媒體文件集進行訓練得到;
排序模塊,用于按照所述得分對所述各目標多媒體文件進行排序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711409084.4/2.html,轉載請聲明來源鉆瓜專利網。





