[發明專利]一種電視用戶收視偏好分析方法有效
| 申請號: | 201911314363.1 | 申請日: | 2019-12-19 |
| 公開(公告)號: | CN110996144B | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 王宏志;丁小歐;張冠巍 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | H04N21/258 | 分類號: | H04N21/258;H04N21/25 |
| 代理公司: | 北京格允知識產權代理有限公司 11609 | 代理人: | 周嬌嬌 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電視 用戶 收視 偏好 分析 方法 | ||
1.一種電視用戶收視偏好分析方法,其特征在于,該方法包括如下步驟:
S1、從服務器獲取待分析的數據,對數據進行格式整理及清洗,得到清洗后的數據條目;
S2、提取清洗后數據條目中出現的頻道名稱、節目名稱,并對節目進行分類,歸納節目類別;
S3、將清洗后數據條目按頻道名稱分別存儲,并根據時段對數據條目進行歸類;
S4、選定時段,依據歸納得到的節目類別對存儲的數據條目進行分類,統計所選時段內頻道名稱、節目名稱、節目類別出現頻次,得到相應的熱點詞統計報告;
S5、提取清洗后數據條目對應的用戶列表,抽選用戶;
S6、將所選用戶對應的清洗后數據條目按照用戶CA卡號分別存儲,根據時段對數據條目進行歸類,并按照時間順序對事件標識排序,得到用戶在各時段內的時序事件序列;
S7、根據所選用戶對應的時序事件序列生成該用戶的行為模式圖;
S8、根據得到的行為模式圖,提取體現偏好傾向的用戶行為模式;
S9、基于相應的存儲數據進行用戶行為識別,根據識別結果分析所選用戶偏好,得到用戶收視偏好報告;
所述步驟S2中對節目進行分類,歸納節目類別,包括:
S2-1、根據頻道名稱確定頻道類別,將專門類頻道下的各個節目分入其頻道對應的類別中;
S2-2、將綜合類頻道下各個節目,結合其節目名稱中的關鍵詞,分入相應的類別中;
所述步驟S2-1進一步包括,掃描數據條目,獲取數據條目中的頻道名稱;若其屬于專門類頻道,則構成包含頻道名稱的元組,通過標簽或索引的方式將各個元組與其對應的節目類別關聯,建立一次分類知識庫;若其不屬于專門類頻道,則繼續執行步驟S2-2;
所述步驟S2-2進一步包括如下三部分:
建立詞典、掃描數據條目,獲取頻道名稱、節目名稱,構成包含頻道名稱和節目名稱的元組,以各元組作為鍵,建立詞典,并統計各元組的出現頻次,得到包括頻次計數值的節目元組;
分詞與合并、以天為單位,枚舉詞典中所有元素,使用NLP方法對節目名稱進行分詞處理,每個節目名稱至少得到一個關鍵詞;將各個關鍵詞匹配到相應的節目元組中,形成包含頻道名稱、關鍵詞和頻次計數值的關鍵詞元組;將頻道名稱和關鍵詞均相同的關鍵詞元組進行合并,頻次計數值相加;
構成知識庫、讀取并合并所有日期下頻道名稱和關鍵詞均相同的關鍵詞元組,得到匯總后的關鍵詞元組集合,通過標簽或索引的方式將各個關鍵詞元組與其對應的節目類別關聯,建立二次分類知識庫。
2.根據權利要求1所述的方法,其特征在于,
所述步驟S1中對數據進行清洗,包括剔除不可用錯誤項以及修復可用錯誤項;
其中,不可用錯誤項包括編碼錯誤項、字段約束錯誤項;可用錯誤項包括字段文字明顯錯誤項、字段部分內容丟失項。
3.根據權利要求1所述的方法,其特征在于,
所述步驟S4中,依據歸納得到的節目類別對存儲的數據條目進行分類進一步包括:
S4-1、根據所選時段提取存儲的數據條目,得到由頻道名稱和節目名稱構成的節目二元組;
S4-2、在一次分類知識庫中查詢節目二元組中的頻道名稱,若存在,則返回該節目二元組對應的節目類別并結束,若不存在,則繼續執行步驟S4-3;
S4-3、使用NLP方法對節目二元組中的節目名稱進行分詞,每個節目名稱得到至少一個關鍵詞;對于每個節目二元組,將頻道名稱與分詞得到的各個關鍵詞分別組成關鍵詞二元組,在二次分類知識庫中查詢各個關鍵詞二元組,返回關鍵詞二元組對應的節目類別;將關鍵詞二元組對應的節目類別逐個列出,并分別計算各節目類別對應頻次在所有節目類別對應頻次之和中所占比例,作為判斷該節目二元組屬于該節目類別的概率。
4.根據權利要求1所述的方法,其特征在于,
所述步驟S5中,在抽選用戶前,統計各個用戶的事件觸發頻次并設置抽樣頻次閾值;抽選用戶時,根據事件觸發頻次及抽樣頻次閾值進行有選擇抽樣。
5.根據權利要求1所述的方法,其特征在于,
所述步驟S7中,生成行為模式圖時,以事件標識作為節點、相鄰事件先后順序作為有向邊,構建狀態轉移圖,并設置初始頻次閾值,刪除狀態轉移圖中出現頻次低于初始頻次閾值的邊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911314363.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種吸氣劑片托復合機
- 下一篇:一種自動射蠟模具設備





