[發明專利]視頻網站的垂直搜索方法及其系統有效
| 申請號: | 201310740723.0 | 申請日: | 2013-12-26 |
| 公開(公告)號: | CN103714158A | 公開(公告)日: | 2014-04-09 |
| 發明(設計)人: | 曹坤波;鄭磊 | 申請(專利權)人: | 樂視網信息技術(北京)股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許志勇 |
| 地址: | 100089 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 網站 垂直 搜索 方法 及其 系統 | ||
技術領域
本發明涉及信息檢索技術,尤其涉及一種視頻網站的垂直搜索方法及其系統。
背景技術
隨著科技的發展,越來越多的用戶通過互聯網搜索并觀看各種視頻。由于互聯網提供的視頻信息十分豐富,并具有不斷變化及更新的特點,隨之產生了多種搜索引擎進行視頻信息檢索。
在關系數據庫系統中,索引是檢索數據最有效率的方式。但對于全網的視頻搜索引擎,并不能滿足其特殊要求。由于搜索引擎面對的是全網的海量視頻數據,例如樂視網等大型的視頻網站搜索引擎索引都是億級甚至幾千億的網頁數量,面對如此海量的視頻數據,使得數據庫系統很難有效的管理。
在進行全網搜索時,會產生大量的檢索結果,而用戶需要的有用信息不能快速地查找到,不能夠滿足排序需求。
綜上所述可知,現有技術中對海量視頻資源的垂直搜索尚未提出有效地解決方案,因此有必要提出改進的技術手段解決上述問題。
發明內容
本發明的主要目的在于提供一種視頻網站的垂直搜索方法及其系統,以解決現有技術存在的缺少有效的視頻資源的垂直搜索技術方案的問題。
根據本發明的一方面,提供一種視頻網站的垂直搜索方法,其包括:獲取多種維度的視頻數據的數據源,將所述數據源轉換為按照預定數據結構建立的數據模型,并將所述數據模型存儲為物化視圖文件;根據所述物化視圖文件建立視頻數據的倒排索引文件;根據接收到的檢索信息,從所述倒排索引文件中獲取視頻數據的倒排索引結果集;根據選定的排序參數對所述倒排索引結果集進行排序。
其中,所述視頻數據包括基礎數據和擴展數據;所述將所述數據源轉換為按照預定數據結構建立的數據模型,包括:將所述基礎數據按照橫表的方式進行存儲,將所述擴展數據按照列表的方式進行存儲。
其中,所述根據所述物化視圖文件建立視頻數據的倒排索引文件,包括:通過預設的分詞方式對物化視圖文件進行分詞處理得到關鍵詞;建立所述關鍵詞與具有所述關鍵詞的物化視圖文件之間的索引關系,從而建立視頻數據的倒排索引文件。
其中,所述根據接收到的檢索信息,從所述倒排索引文件中獲取視頻數據的倒排索引結果集,包括:接收對于視頻數據的檢索信息;在所述倒排索引文件中匹配所述檢索信息,根據與所述檢索信息匹配的所述倒排索引文件中的數據得到所述倒排索引結果集。
其中,在所述根據選定的排序參數對倒排索引結果集進行排序之前,所述方法還包括:接收用戶選定的排序參數,所述排序參數包括:視頻類型、上映時間、播放時長、視頻文件相關的信息。
根據本發明的另一方面,還提供一種視頻網站的垂直搜索系統,其包括:數據源處理模塊,用于獲取多種維度的視頻數據的數據源,將所述數據源轉換為按照預定數據結構建立的數據模型,并將所述數據模型存儲為物化視圖文件;倒排索引模塊,用于根據所述物化視圖文件建立視頻數據的倒排索引文件,以及根據接收到的檢索信息,從所述倒排索引文件中獲取視頻數據的倒排索引結果集;排序模塊,用于根據選定的排序參數對所述倒排索引結果集進行排序。
其中,所述視頻數據包括基礎數據和擴展數據;所述數據源處理模塊進一步包括:處理子模塊,用于將所述基礎數據按照橫表的方式進行存儲,將所述擴展數據按照列表的方式進行存儲。
其中,所述倒排索引模塊包括:關鍵詞獲取子模塊,用于通過預設的分詞方式對物化視圖文件進行分詞處理得到關鍵詞;倒排索引建立子模塊,用于建立所述關鍵詞與具有所述關鍵詞的物化視圖文件之間的索引關系,從而建立視頻數據的倒排索引文件。
其中,所述倒排索引模塊還包括:檢索信息接收子模塊,用于接收對于視頻數據的檢索信息;匹配子模塊,用于在所述倒排索引文件中匹配所述檢索信息,并根據與所述檢索信息匹配的所述倒排索引文件中的數據得到所述倒排索引結果集。
其中,所述排序模塊包括:參數接收子模塊,用于接收用戶選定的排序參數,所述排序參數包括:視頻類型、上映時間、播放時長、視頻文件相關的信息;排序子模塊,用于根據所述參數接收模塊接收的排序參數對倒排索引結果集進行排序。
根據本發明的技術方案,通過將多維度數據源建立數據模型,建立倒排索引文件,并根據排序參數對倒排索引結果集進行排序,有效提高了視頻資源的檢索效率,實現了視頻資源的垂直搜索。
附圖說明
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
圖1和圖2是根據本發明實施例的視頻網站的垂直搜索方法的流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于樂視網信息技術(北京)股份有限公司,未經樂視網信息技術(北京)股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310740723.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鏤空竹球固定夾板
- 下一篇:新型窗簾





