[發明專利]推薦多媒體文件的方法及裝置在審
| 申請號: | 201611235464.6 | 申請日: | 2016-12-28 |
| 公開(公告)號: | CN106611059A | 公開(公告)日: | 2017-05-03 |
| 發明(設計)人: | 高陽;丁曉亮;劉爽 | 申請(專利權)人: | 北京小米移動軟件有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司11138 | 代理人: | 林錦瀾 |
| 地址: | 100085 北京市海淀區清河*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 推薦 多媒體 文件 方法 裝置 | ||
技術領域
本公開涉及互聯網技術領域,尤其涉及一種推薦多媒體文件的方法及裝置。
背景技術
隨著信息時代的到來,服務器中存儲的視頻文件越來越多;用戶可以使用終端從服務器中獲取用戶感興趣的視頻文件。為了提高用戶的體驗,服務器還可以為用戶推薦用戶感興趣的視頻文件。
目前,服務器在為用戶推薦視頻文件時,統計服務器中每個視頻文件的點擊率,根據每個視頻文件的點擊率,選擇點擊率最高的視頻文件,向用戶推薦選擇的視頻文件。
發明內容
為克服相關技術中存在的問題,本公開提供一種推薦多媒體文件的方法及裝置,所述技術方案如下:
根據本公開實施例的第一方面,提供一種推薦多媒體文件的方法,所述方法包括:
獲取終端對應的第一多媒體文件的第一標簽信息,所述第一標簽信息為基于所述第一多媒體文件的第一字幕信息提取的;
根據所述第一標簽信息和多媒體文件庫中每個第二多媒體文件的第二標簽信息,從所述多媒體文件庫中選擇第二標簽信息與所述第一標簽信息匹配的第二多媒體文件,所述每個第二多媒體文件的第二標簽信息為基于所述每個第二多媒體文件的第二字幕信息提取的;
向所述終端發送所述第二多媒體文件的標識。
在本公開實施例中,由于第一標簽信息為基于第一多媒體文件的第一字幕信息提取的,每個第二多媒體文件的第二標簽信息為基于每個第二多媒體文件的第二字幕信息提取的,因此提取的第一標簽信息和每個第二多媒體文件的第二標簽信息較準確,從而根據第一標簽信息和每個第二多媒體文件的第二標簽信息,向用戶推薦第二多媒體文件,能夠提高向用戶推薦第二多媒體文件的準確性。
在一種可能實現方式中,所述獲取終端對應的第一多媒體文件的第一標簽信息,包括:
獲取所述第一多媒體文件的第一字幕信息;
對所述第一字幕信息進行分詞,得到第一關鍵詞集合;
對所述第一關鍵詞集合中的每個關鍵詞進行分析,得到所述第一標簽信息。
在本公開實施例中,通過對第一多媒體文件的第一字幕信息進行語義分析,提取第一多媒體文件的第一標簽信息,從而提高了第一標簽信息的準確性。
在一種可能實現方式中,所述對所述第一關鍵詞集合中的每個關鍵詞進行分析,得到所述第一標簽信息,包括:
獲取所述每個關鍵詞在所述第一字幕信息中的概率,以及,獲取所述每個關鍵詞屬于主題信息庫中的每個主題信息的概率,所述主題信息庫用于存儲多個預設的主題信息;
根據所述每個關鍵詞在所述第一字幕信息中的概率和所述每個關鍵詞屬于每個主題信息的概率,確定所述第一多媒體文件屬于所述每個主題信息的概率;
根據所述第一多媒體文件屬于所述每個主題信息的概率,從所述每個主題信息中選擇概率最大的預設數目個主題信息;
將選擇的預設數目個主題信息組成所述第一標簽信息。
在本公開實施例中,根據每個關鍵詞在第一字幕信息中的概率和每個關鍵詞屬于每個主題信息的概率,確定第一多媒體文件屬于每個主題信息的概率;根據第一多媒體文件屬于每個主題信息的概率,從每個主題信息中選擇概率最大的預設數目個主題信息,從而提高了第一標簽信息的準確性。
在一種可能實現方式中,所述根據所述每個關鍵詞在所述第一字幕信息中的概率和所述每個關鍵詞屬于每個主題信息的概率,確定所述第一多媒體文件屬于所述每個主題信息的概率,包括:
將所述每個關鍵詞在所述第一字幕信息中的概率組成第一概率矩陣,以及,將所述每個關鍵詞屬于每個主題信息的概率組成第二概率矩陣;
將所述第二概率矩陣的逆矩陣與所述第一概率矩陣相乘,得到第三概率矩陣;
從所述第三概率矩陣中獲取所述第一多媒體文件屬于所述每個主題信息的概率。
在本公開實施例中,將每個關鍵詞在第一字幕信息中的概率組成第一概率矩陣,將每個關鍵詞屬于每個主題信息的概率組成第二概率矩陣,根據第一概率矩陣和第二概率矩陣,確定第一多媒體文件屬于每個主題信息的概率,提高了確定出第一多媒體文件屬于每個主題信息的概率的準確性,進而提高了第一標簽信息的準確性。
在一種可能實現方式中,所述獲取所述每個關鍵詞屬于主題信息庫中的每個主題信息的概率,包括:
對于所述每個主題信息,獲取所述主題信息對應的預設關鍵詞集合;
根據所述每個關鍵詞在所述第一字幕信息中的概率、所述預設關鍵詞集合和所述預設關鍵詞集合包含的關鍵詞的數目,確定所述每個關鍵詞屬于所述主題信息的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司,未經北京小米移動軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611235464.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種試題搜索方法及裝置
- 下一篇:一種用于GIS的數據處理方法





