[發明專利]視頻網站的垂直搜索方法及其系統有效
| 申請號: | 201310740723.0 | 申請日: | 2013-12-26 |
| 公開(公告)號: | CN103714158A | 公開(公告)日: | 2014-04-09 |
| 發明(設計)人: | 曹坤波;鄭磊 | 申請(專利權)人: | 樂視網信息技術(北京)股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許志勇 |
| 地址: | 100089 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 網站 垂直 搜索 方法 及其 系統 | ||
1.一種視頻網站的垂直搜索方法,其特征在于,包括:
獲取多種維度的視頻數據的數據源,將所述數據源轉換為按照預定數據結構建立的數據模型,并將所述數據模型存儲為物化視圖文件;
根據所述物化視圖文件建立視頻數據的倒排索引文件;
根據接收到的檢索信息,從所述倒排索引文件中獲取視頻數據的倒排索引結果集;
根據選定的排序參數對所述倒排索引結果集進行排序。
2.根據權利要求1所述的方法,其特征在于,所述視頻數據包括基礎數據和擴展數據;所述將所述數據源轉換為按照預定數據結構建立的數據模型,包括:
將所述基礎數據按照橫表的方式進行存儲,將所述擴展數據按照列表的方式進行存儲。
3.根據權利要求1所述的方法,其特征在于,所述根據所述物化視圖文件建立視頻數據的倒排索引文件,包括:
通過預設的分詞方式對物化視圖文件進行分詞處理得到關鍵詞;
建立所述關鍵詞與具有所述關鍵詞的物化視圖文件之間的索引關系,從而建立視頻數據的倒排索引文件。
4.根據權利要求3所述的方法,其特征在于,所述根據接收到的檢索信息,從所述倒排索引文件中獲取視頻數據的倒排索引結果集,包括:
接收對于視頻數據的檢索信息;
在所述倒排索引文件中匹配所述檢索信息,根據與所述檢索信息匹配的所述倒排索引文件中的數據得到所述倒排索引結果集。
5.根據權利要求1所述的方法,其特征在于,在所述根據選定的排序參數對倒排索引結果集進行排序之前,所述方法還包括:
接收用戶選定的排序參數,所述排序參數包括:視頻類型、上映時間、播放時長、視頻文件相關的信息。
6.一種視頻網站的垂直搜索系統,其特征在于,包括:
數據源處理模塊,用于獲取多種維度的視頻數據的數據源,將所述數據源轉換為按照預定數據結構建立的數據模型,并將所述數據模型存儲為物化視圖文件;
倒排索引模塊,用于根據所述物化視圖文件建立視頻數據的倒排索引文件,以及,根據接收到的檢索信息,從所述倒排索引文件中獲取視頻數據的倒排索引結果集;
排序模塊,用于根據選定的排序參數對所述倒排索引結果集進行排序。
7.根據權利要求6所述的系統,其特征在于,所述視頻數據包括基礎數據和擴展數據;所述數據源處理模塊進一步包括:
處理子模塊,用于將所述基礎數據按照橫表的方式進行存儲,將所述擴展數據按照列表的方式進行存儲。
8.根據權利要求6所述的系統,其特征在于,所述倒排索引模塊包括:
關鍵詞獲取子模塊,用于通過預設的分詞方式對物化視圖文件進行分詞處理得到關鍵詞;
倒排索引建立子模塊,用于建立所述關鍵詞與具有所述關鍵詞的物化視圖文件之間的索引關系,從而建立視頻數據的倒排索引文件。
9.根據權利要求8所述的系統,其特征在于,所述倒排索引模塊還包括:
檢索信息接收子模塊,用于接收對于視頻數據的檢索信息;
匹配子模塊,用于在所述倒排索引文件中匹配所述檢索信息,并根據與所述檢索信息匹配的所述倒排索引文件中的數據得到所述倒排索引結果集。
10.根據權利要求6所述的系統,其特征在于,所述排序模塊包括:
參數接收子模塊,用于接收用戶選定的排序參數,所述排序參數包括:視頻類型、上映時間、播放時長、視頻文件相關的信息;
排序子模塊,用于根據所述參數接收模塊接收的排序參數對倒排索引結果集進行排序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于樂視網信息技術(北京)股份有限公司,未經樂視網信息技術(北京)股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310740723.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鏤空竹球固定夾板
- 下一篇:新型窗簾





