[發明專利]一種視頻用戶性別分類方法及其裝置有效
| 申請號: | 201410037302.6 | 申請日: | 2014-01-26 |
| 公開(公告)號: | CN103729785A | 公開(公告)日: | 2014-04-16 |
| 發明(設計)人: | 房曉宇;江建博;朱凱泉;章岑;張緩迅;姚鍵;潘柏宇;盧述奇 | 申請(專利權)人: | 合一信息技術(北京)有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 用戶 性別 分類 方法 及其 裝置 | ||
1.一種視頻用戶性別分類方法,包括如下步驟:
標簽屬性提取步驟:利用標定用戶的觀看記錄,以及視頻的標簽信息,提取每一個標簽觀看人群的男女構成,將所述標簽的男女觀眾所占比例作為所述視頻的標簽的標簽屬性,其中所述標定用戶指的是已知性別的用戶;
特性標簽篩選步驟:根據所得到的標簽屬性,選擇性別區分性顯著地標簽,作為特性標簽,過濾掉沒有區分性或者區分性小的標簽;
標簽特征定義步驟:針對每個特性標簽的性別比例,得到所述特性標簽的標簽特征;
觀看行為特征提取步驟:根據用戶的觀看記錄,找到該用戶一段時間內觀看的所有視頻,將這些視頻對應到其各自的特性標簽,利用所述特性標簽的標簽特征,來獲得該用戶這段時間內觀看行為特征;
性別分類模型訓練步驟:通過已知性別用戶以及其在一段時間內觀看行為特征,利用分類器訓練得到性別分類模型;
性別分類預測步驟:對于每一個未知性別用戶,利用其一段時間內觀看行為特征,結合所述性別分類模型,判定其性別屬性。
2.根據權利要求1所述的,其特征在于:
所述標簽屬性提取步驟,具體包括如下步驟:
首先,從帶標簽的視頻庫中,提取出每一個視頻的所有標簽,
然后,利用有標定的用戶一段時間內的觀看記錄統計每一個標簽上的不同性別的觀看次數,
最后,計算每個標簽的男女觀看比例,從而得到所述標簽屬性;
所述特性標簽篩選步驟,具體包括如下步驟:
首先,設定充分統計量閾值Nt,性別區分性閾值Pt,
然后,以所述標簽的統計量作為統計量表述,以所述標簽的男女所占比率的差的絕對值作為標簽的區分性表述,
最后,分別將所述統計量表述與所述充分統計量閾值Nt做比較,所述區分性表述與性別區分性閾值Pt做比較,將區分性表述小于性別區分性閾值Pt或者所述統計量表述小于所述充分統計量閾值Nt的標簽濾除,剩余的標簽作為特性標簽;
所述標簽特征定義步驟具體為,利用公式(1)定義標簽特征????????????????????????????????????????????????,
?????????公式(1)
其中,標示觀看該標簽的男性比率,表示一段時間內該標簽的男性觀眾觀看次數,表示一段時間內該標簽的總觀看次數,0.5為歸一化參數;
觀看行為特征提取步驟,具體包括如下步驟:
首先統計用戶在一段時間內,觀看的視頻,每個視頻包括若干個標簽,將視頻對應到各自的特征標簽,得到用戶在該一段時間內的標簽集合{tag1,...,tagm},利用公式(2)計算該用戶的觀看行為特征:
??????公式(2)
其中,為該用戶在tagi上的觀看次數,為該用戶這段時間內總的觀看次數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合一信息技術(北京)有限公司,未經合一信息技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410037302.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:治療坐骨神經痛的中藥組合物及其制備方法
- 下一篇:一種祛痘中藥膏





