[發明專利]一種基于視頻搜索的在線播放入口對象的推送方法和裝置在審
| 申請號: | 201310462768.6 | 申請日: | 2013-09-30 |
| 公開(公告)號: | CN103488787A | 公開(公告)日: | 2014-01-01 |
| 發明(設計)人: | 崔代超 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 趙娟 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 視頻 搜索 在線播放 入口 對象 推送 方法 裝置 | ||
技術領域
本發明涉及互聯網的技術領域,具體涉及一種基于視頻搜索的在線播放入口對象的推送方法和一種基于視頻搜索的在線播放入口對象的推送裝置。
背景技術
視頻搜索引擎是有別于綜合搜索的一種垂直搜索技術。視頻搜索引擎抓取互聯網中的視頻類的結果并建立索引,由于它可以向搜索者提供純粹的視頻類結果,從而可以大大節省網民尋找視頻的時間。
根據視頻搜索的相關統計數據顯示,娛樂、游戲、影視、新聞、動漫等類型的視頻是用戶的主要搜索對象。這表明用戶對于視頻搜索本身具有泛需求的性質。用戶往往不帶有很強的目的性,搜索結果并非“非彼不可”,而是帶有一定擴展性,只要目標在用戶所喜歡的范疇內即可。因此,往往會在搜索結果之外對用戶進行相關推薦是。
但是,現有的視頻搜索引擎在相關推薦方面做得還有不足:部分視頻搜索引擎沒有相關推薦,有相關推薦的視頻搜索引擎只是根據用戶的搜索歷史數據、通過人工整理得到關聯體系等簡單方式實現推薦。這種推薦系統基于用戶已有的搜索習慣,召回率較低,另外由于用戶的搜索范圍一般會比現有互聯網中的資源范圍要小很多,不能充分挖掘互聯網中的優質視頻。
另一種搜索推薦方法是依靠人工整理出一個資源關聯體系或從其他知識體系中得到這樣的體系,應用到推薦系統中。例如在某搜索引擎搜索”廣場舞”時,會得到“交誼舞”、“肚皮舞”、“健身操”等的推薦詞,搜索“dota”時會得到“穿越火線”、“魔獸世界”等的推薦詞,但是這種體系召回率較低,在長尾的搜索中一般不能給出推薦。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的一種基于視頻搜索的在線播放入口對象的推送方法和相應的一種基于視頻搜索的在線播放入口對象的推送裝置。
依據本發明的一個方面,提供了一種基于視頻搜索的在線播放入口對象的推送方法,包括:
接收視頻搜索字符串;
將所述視頻搜索字符串映射為一個或多個第一分詞;
查找與所述一個或多個第一分詞的同現率高于預設閾值的關聯第二分詞;所述同現率為當前一個或多個第一分詞與第二分詞在同一視頻資源數據中共同出現的概率;
獲取與所述一個或多個第一分詞和所述關聯第二分詞匹配的一個或多個視頻數據資源的網絡地址;
根據所述一個或多個視頻數據資源網絡地址構造在線播放所述視頻數據資源的入口對象;
推送所述一個或多個在線播放視頻數據資源的入口對象。
可選地,所述將所述視頻搜索字符串映射為一個或多個第一分詞的步驟包括:
提取所述視頻搜索字符串所映射的一個分詞;
或者,
當接收到的視頻搜索字符串為復合詞時,將所述視頻搜索字符串拆分為多個搜索子詞;提取所述多個搜索子詞所映射的多個分詞。
可選地,所述查找與所述一個或多個第一分詞的同現率高于預設閾值的關聯第二分詞的步驟包括:
當所述視頻搜索字符串被映射為一個第一分詞時,提取所述第一分詞對應的預置索引表;其中,所述索引表包括所述第一分詞所屬的視頻資源數據的信息,以及,所述視頻資源數據中的所有分詞;所述視頻資源數據中的所有分詞為通過抓取視頻資源數據,提取所述視頻資源數據的特征文本信息,對所述特征文本信息進行分詞生成;
計算所述第一分詞與所述索引表中各個第二分詞的同現率,所述同現率為所述索引表中各個第二分詞出現的次數與所述索引表中視頻資源數據的信息總數的比值;其中,所述第二分詞為所述視頻資源數據中的所有分詞中除所述第一分詞以外的分詞;
提取所述同現率高于預設閾值的第二分詞作為關聯第二分詞。
可選地,所述查找與所述一個或多個第一分詞的同現率高于預設閾值的關聯第二分詞的步驟包括:
當所述視頻搜索字符串被映射為多個第一分詞時,分別提取所述多個第一分詞對應的多個預置索引表;各個索引表中包括所述第一分詞所屬的視頻資源數據的信息,以及,所述視頻資源數據中的所有分詞;所述視頻資源數據中的所有分詞為通過抓取視頻資源數據,提取所述視頻資源數據的特征文本信息,對所述特征文本信息進行分詞生成;
提取與所述多個第一分詞共同出現的第二分詞作為候選分詞;其中,所述第二分詞為所述視頻資源數據中的所有分詞中除所述第一分詞以外的分詞;
分別在各個索引表中計算所述第一分詞與所述候選分詞的同現率,所述同現率為所述索引表中候選分詞出現的次數與所述索引表中視頻資源數據的信息總數的比值;
分別為所述多個第一分詞與所述候選分詞的同現率配置對應的多個權重;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310462768.6/2.html,轉載請聲明來源鉆瓜專利網。





