[發明專利]一種網絡視頻終端聚合方法及系統有效
| 申請號: | 201310166163.2 | 申請日: | 2013-05-08 |
| 公開(公告)號: | CN104144181B | 公開(公告)日: | 2017-12-29 |
| 發明(設計)人: | 張輝;李長路;孫鵬;潘梁 | 申請(專利權)人: | 中國科學院聲學研究所;北京海力匯通數字系統技術有限公司 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08;G06F17/30 |
| 代理公司: | 北京法思騰知識產權代理有限公司11318 | 代理人: | 楊小蓉,楊林 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 視頻 終端 聚合 方法 系統 | ||
技術領域
本發明涉及數據挖掘領域,信息聚合領域,實現利用終端用戶信息對用戶興趣的挖掘,提取多維興趣主題,并以此為據,將用戶訂閱的視頻網站中,用戶感興趣的視頻聚合到用戶終端。
背景技術
傳統的終端媒體信息管理局限于本地媒體信息數據庫的管理和更新,以供用戶查閱,以及在用戶操作時向交互系統提供必要的信息支持。在三網融合背景下,作為網絡終端的電視機智能終端操作系統,不再滿足于對本地存儲信息的查閱,而需要根據用戶的需要提供更豐富的網絡視頻信息。把互聯網視頻網站中用戶感興趣的視頻像本地視頻一樣呈現給用戶點擊播放,已經成為趨勢。
目前用戶獲取網絡視頻的手段包括視頻網站瀏覽,搜索,推薦,以及少量的c/s聚合系統。網頁瀏覽和搜索在pc終端上應用廣泛,但對于電視機、手機等并不擅長鍵鼠操作的智能終端來講,明顯增加了用戶負擔,降低了用戶體驗。現有的聚合系統都采用服務器/終端模式,使用戶面臨著必須注冊、反饋,并且被迫接受服務端廣告等冗余信息困境。
另一方面,網絡信息資源的海量增長和用戶貢獻內容的不斷擴充,給用戶帶來資源選擇多樣化和自主化的同時,也帶來選擇迷航的問題,而當互聯網的信息量越來越大,搜索引擎這種基于內容本身呈現信息的方式再怎么改良,也無法避免冗余的信息。大量冗余信息的存在也會成為用戶和終端的負擔。
發明內容
本發明的目的在于,提供一種終端主動聚合網絡視頻的方法,能夠有效擴展視頻來源,充分享受海量增長的網絡視頻源給用戶帶來資源選擇多樣化和自主化的同時,避免其帶來的選擇迷航問題。同時還要避免目前主要方案中需要注冊、提交用戶信息、顯式獲取興趣等智能終端用戶,尤其是電視機用戶通常不愿意做的事情。
為實現上述目的,本發明提供了一種網絡視頻終端聚合方法,所述方法包含:
步驟101)通過訂閱指定網絡視頻聚合的源;
步驟102)利用爬蟲從訂閱網站提取網絡視頻元數據;
步驟103)將本地播放記錄和本地視頻信息存儲在本地數據庫;
步驟104)對本地數據庫數據進行預處理,以適應興趣挖掘需要,其中,所述預處理是對數據庫中存儲的視頻信息逐條過濾,剔除無效信息記錄,選取符合條件的數據用于興趣挖掘;
步驟105)根據本地數據庫,挖掘用戶多維興趣主題,所述本地數據庫以一定的數據結構存儲若干條視頻元數據描述,這些視頻對象包括本地存儲的視頻文件,以及用戶播放記錄中的視頻;
步驟106)根據網絡視頻與用戶興趣的匹配程度對網絡視頻進行過濾排序,所述匹配過濾依次將每一條網絡視頻描述信息與興趣主題匹配,過濾并保留匹配程度高于閾值的結果,并排序;
步驟107)顯示經過濾、排序而得的網絡視頻列表。
上述網絡視頻元數據包括:視頻名、視頻源地址、年份、導演、演員或類型,將所有元數據形成網絡視頻的多維描述信息。
上述指定視頻聚合源的網站是一個或多個視頻網站的首頁網址。
上述爬蟲模塊以訂閱模塊指定的一個或多個網頁為初始頁面,提取視頻元數據,為每一個視頻生成一條元數據描述,并嵌套地對其包含的二級頁面逐一遍歷,以獲取符合條件的視頻元數;同時,獲取元數據的方式還可選地包括直接收割網站按一定規范發布的視頻信息。
多維興趣主題即為在兩個或兩個以上維度進行描述的興趣主題,其基礎為,每一條視頻信息都由多個維度的描述信息組成。
多維興趣主題的提取分為以下步驟:
a、一維興趣提取:對每一個擬挖掘的維度采取獨立的興趣挖掘策略和標準,得到該維度上的若干興趣主題,成為一個集合;
b、二維興趣提取:在不同維度間,若兩個興趣主題同時出現在一條多維信息中,則這兩個興趣主題有關聯;同時出現越多,關聯越大;把關聯度大過閾值的組合在一起,成為一個二維興趣主題,采用同樣的方法找出所有的二維興趣主題;
c、多維興趣提取:若某維度上的主題出現在兩個多維主題中,檢查是否這兩個多維主題中每個一維主題間都存在超過閾值的關聯程度,若是,則合并這兩個多維主題,成為更高維度的興趣主題;
d、記錄所有不能進一步合并的多維興趣主題。
為了實現上述目的,本發明還提供了一種網絡視頻終端聚合系統,所述系統包含:
訂閱模塊,用于指定網絡視頻聚合的源;
爬蟲模塊,用于從訂閱模塊獲得的網絡視頻聚合源的網站提取網絡視頻元數據;
本地數據庫模塊,用于存儲本地播放記錄和本地視頻信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院聲學研究所;北京海力匯通數字系統技術有限公司,未經中國科學院聲學研究所;北京海力匯通數字系統技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310166163.2/2.html,轉載請聲明來源鉆瓜專利網。





