[發明專利]電視用戶畫像的構建方法有效
| 申請號: | 201710343327.2 | 申請日: | 2017-05-16 |
| 公開(公告)號: | CN107124653B | 公開(公告)日: | 2020-09-29 |
| 發明(設計)人: | 韓亞;尹娟;李足紅 | 申請(專利權)人: | 四川長虹電器股份有限公司 |
| 主分類號: | H04N21/45 | 分類號: | H04N21/45;H04N21/25;H04N21/258 |
| 代理公司: | 四川省成都市天策商標專利事務所 51213 | 代理人: | 袁辰亮;劉渝 |
| 地址: | 621000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電視 用戶 畫像 構建 方法 | ||
本發明公開了一種電視用戶畫像的構建方法,所述的方法包括以下步驟:步驟一、通過數據平臺采集電視終端用戶的數據并解析分類;步驟二、預定義電視用戶畫像標簽;步驟三、對B類數據進行分類,構建B類數據電視用戶畫像一級標簽;步驟四、對C類數據進行分類,構建C類數據電視用戶畫像一級標簽;步驟五、構建B類和C類數據電視用戶畫像二級標簽;步驟六、將電視用戶畫像每類一級標簽和二標簽進行合并統計;步驟七、分析電視用戶的節目類型偏好屬性數據,構建電視用戶畫像標簽;步驟八、將構建的電視用戶畫像標簽更新預定義的電視用戶畫像標簽。本發明通過分析電視用戶觀看行為數據,從而了解用戶喜好,更好的為用戶提供個性化服務。
技術領域
本發明涉及利用用戶數據進行用戶畫像的構建方法,具體涉及一種電視用戶畫像的構建方法。
背景技術
隨著時代的發展和進步,現在幾乎每家每戶都會有電視,用戶會觀看各個類型的電視節目,而隨著網絡的發展各個類型的視頻節目沖擊著電視用戶。對于電視用戶來說,每個類型的電視節目會有許多,而客戶端中顯示的視頻內容有限,用戶從大量的視頻中逐一選取喜愛的節目比較費時。而對于電視廠商來說,面對差異化的電視用戶,如果能夠了解用戶的喜好,能夠為用戶推薦其喜歡的電視節目,為用戶提供個性化服務,不僅能夠很好的留住用戶,而且能夠吸引更多的用戶來關注該電視產品,具有重要意義。
同時語音識別系統已經應用到智能電視中,因此,在采集數據時,會有一類語音數據。語音數據是用戶所說的內容,其千遍萬化,用戶會根據自己的個性或習慣來說自己想看的內容。目前對于語音識別主要是理解用戶所說的意圖,比如用戶說“我想看電影”,通過目前的語義理解能根據關鍵詞“看”和“電影”來識別用戶的意圖,然而如果用戶說“我想看甄嬛傳”,目前能夠識別到用戶“看”的動作,而對于“甄嬛傳”到底是什么視頻無法區分。
發明內容
本發明克服了現有技術的不足,提供一種電視用戶畫像的構建方法。
為解決上述的技術問題,本發明采用以下技術方案:
一種電視用戶畫像的構建方法,所述的方法包括以下步驟:
步驟一、通過數據平臺采集電視終端用戶的數據并解析分類;將采集的數據分為三類,包括:A類:用戶的基本屬性數據;B類:直接通過用戶點擊得到的用戶數據;C類:用戶通過語音功能觀看的電視數據;
步驟二、根據電視用戶的行為數據預定義電視用戶畫像標簽;
步驟三、對獲取的B類數據進行匹配分類,構建B類數據電視用戶畫像一級標簽;
步驟四、對獲取的C類數據進行分類,構建C類數據電視用戶畫像一級標簽;
步驟五、根據B類數據和C類數據分別構建B類數據電視用戶畫像二級標簽和C類數據電視用戶畫像二級標簽;
步驟六、將電視用戶畫像每類一級標簽和二標簽進行合并統計,計算每類數據觀看的總次數和總時長,以及統計每類數據中二級標簽信息的頻次;
步驟七、根據統計的數據,分析電視用戶的節目類型偏好屬性數據,并根據所述偏好屬性數據構建電視用戶畫像標簽;
步驟八、將構建的電視用戶畫像標簽更新預定義的電視用戶畫像標簽。
更進一步的技術方案是所述的步驟一包括:對采集的數據通過Hadoop中的MapReduce框架解析采集到的源數據,提取用戶的信息。
更進一步的技術方案是所述的步驟三包括:
步驟1,定時解析更新媒資平臺的數據,并將該數據放到媒資數據庫中;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川長虹電器股份有限公司,未經四川長虹電器股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710343327.2/2.html,轉載請聲明來源鉆瓜專利網。





