[發明專利]一種基于網絡流量的用戶點播信息獲取方法及系統有效
| 申請號: | 201610959532.7 | 申請日: | 2016-10-27 |
| 公開(公告)號: | CN107995528B | 公開(公告)日: | 2019-12-17 |
| 發明(設計)人: | 葉曉舟;黨壽江 | 申請(專利權)人: | 中國科學院聲學研究所;上海尚恩華科網絡科技股份有限公司 |
| 主分類號: | H04N21/442 | 分類號: | H04N21/442;H04N21/466;H04N21/472;H04L29/06 |
| 代理公司: | 11472 北京方安思達知識產權代理有限公司 | 代理人: | 王宇楊;楊青 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 網絡流量 用戶 點播 信息 獲取 方法 系統 | ||
本發明公開了一種基于網絡流量的用戶點播信息獲取方法,所述方法包括:步驟1)對媒體網站的節目信息進行爬取,并記錄爬取的信息;步驟2)對網絡節點的數據進行采集并提取用戶點播網絡會話信息;步驟3)將用戶點播網絡會話中的點播信息與爬取的媒體網站節目信息進行匹配;步驟4)對于匹配成功的用戶點播網絡會話中的點播信息與爬取的媒體網站節目信息,從相應的爬取節目信息中獲得節目名稱、從相應的用戶點播網絡會話中的點播信息中獲得用戶IP地址、點播操作及其時間信息。本發明的方法通過基于網絡流量獲取用戶點播信息,可以全面反映網絡中用戶點播的情況,滿足有線電視網絡運營商和互聯網電視運營商用戶數據挖掘需求和網絡運營與監管需求。
技術領域
本發明涉及計算機及網絡技術領域,尤其涉及一種基于網絡流量的用戶點播信息獲取方法。
背景技術
用戶點播信息是有線電視網絡運營商和互聯網電視運營商用戶數據挖掘的基礎數據,也是網絡運營與監管的重要參考依據。用戶點播信息數據一般以日志的方式被媒體網站或者有線電視服務提供商記錄并提取處理,為用戶個性化推薦等大數據應用提供數據支撐。還有一種方式是通過網絡審計進行該媒體網站或者有線電視服務提供商的第三方數據記錄,并通過與日志數據對比,驗證用戶點播數據的真實性,為廣告付費等提供數據驗證。以上方式只能反映單一的媒體網站或者有線電視服務提供商的用戶點播信息,是私有的數據孤島,無法整合與全面反映網絡中的用戶點播行為,無法支撐網絡運營和監管要求。
另一方面,通過在有線網絡運營商的網絡節點部署網絡數據采集設備,可以采集記錄網絡節點中所有流經的網絡流量,并全面還原用戶的網絡會話,但是從中判別用戶的點播請求并提取用戶的實際點播信息則具有很大的技術難度。首先用戶點播請求混雜于海量的網絡流量中,需要進行具體協議和請求消息的判斷提??;其次,用戶點播信息需要獲取用戶點播的是什么節目(如節目名稱),但是用戶點播請求中攜帶的點播信息一般為播放地址、內容標識等不具有語義可讀性的數據,不能夠反應出具體點播的是什么節目。
發明內容
本發明的目的在于克服目前獲取用戶點播行為存在的上述問題,提供一種基于網絡流量的用戶點播信息獲取方法,能夠基于網絡流量獲取用戶點播的節目名稱、點播時間、收看時長等信息,為有線電視網絡運營商和互聯網電視運營商提供用戶數據挖掘的基礎數據,為網絡運營與監管提供參考依據。
為了實現上述目的,本發明提供了一種基于網絡流量的用戶點播信息獲取方法,所述方法包括:
步驟1)對媒體網站的節目信息進行爬取,并記錄爬取的信息;
步驟2)對網絡節點的數據進行采集并提取用戶點播網絡會話信息;
步驟3)將用戶點播網絡會話中的點播信息與爬取的媒體網站節目信息進行匹配;
步驟4)對于匹配成功的用戶點播網絡會話中的點播信息與爬取的媒體網站節目信息,從相應的爬取節目信息中獲得節目名稱、從相應的用戶點播網絡會話中的點播信息中獲得用戶IP地址、點播操作及其時間信息。
上述技術方案中,所述步驟1)中的節目信息包括:節目名稱、節目時長、演員、導演這些節目元數據,以及該節目的播放地址和內容標識這些數據信息。
上述技術方案中,所述步驟2)具體包括:
通過旁路或者串聯的方式從網絡節點采集流經的網絡數據,使用端口號和特征字段匹配的方式判斷是否為用戶點播會話,從用戶點播會話的用戶點播請求中提取用戶IP地址、播放地址、內容標識、開始、快進、快退、暫停、停止操作及時間點播相關信息并進行記錄。
上述技術方案中,所述步驟3)的將用戶點播網絡會話中的點播信息與爬取的媒體網站節目信息進行匹配包括:使用用戶點播網絡會話中的播放地址、內容標識信息與從媒體網站爬取的播放地址、內容標識信息進行匹配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院聲學研究所;上海尚恩華科網絡科技股份有限公司,未經中國科學院聲學研究所;上海尚恩華科網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610959532.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自診斷LED顯示屏系統
- 下一篇:級聯處理器故障處理方法、系統和裝置





