[發明專利]一種識別目標主播的方法及系統、介質、設備有效
| 申請號: | 202010584332.4 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111488491B | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 王璐 | 申請(專利權)人: | 武漢斗魚魚樂網絡科技有限公司 |
| 主分類號: | G06F16/78 | 分類號: | G06F16/78;G06F16/75;G06F40/289;H04N21/2187;H04N21/258 |
| 代理公司: | 北京眾達德權知識產權代理有限公司 11570 | 代理人: | 孫朝銳 |
| 地址: | 430000 湖北省武漢市東湖新技術開發區軟件園東路*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 目標 方法 系統 介質 設備 | ||
1.一種識別目標主播的方法,其特征在于,所述方法包括:
獲取多個主播的主播公告、開播IP集合和開播設備集合;
基于所述多個主播的主播公告,獲得表征兩個主播之間主播公告相似度的第一度量值;基于所述多個主播的開播IP集合,獲得表征兩個主播之間開播IP集合相似度的第二度量值;基于所述多個主播的開播設備集合,獲得表征兩個主播之間開播設備集合相似度的第三度量值;
基于所述多個主播的開播IP集合和開播設備集合,獲得由具有相同直播特征主播構成的正樣本集和由具有不同直播特征主播構成的負樣本集;
基于所述第一度量值、第二度量值、第三度量值、正樣本集和負樣本集,獲得關于所述第一度量值、第二度量值和第三度量值的權重向量;
基于所述第一度量值、第二度量值、第三度量值和所述權重向量,獲得表征兩個所述主播之間加權后的相似度的目標參量值;
將所述目標參量值大于預設閾值的兩個所述主播識別為目標主播。
2.如權利要求1所述的方法,其特征在于,所述基于所述多個主播的主播公告,獲得表征兩個主播之間主播公告相似度的第一度量值,具體包括:
將兩個所述主播的主播公告進行分詞,生成詞向量集;
基于所述詞向量集,獲得兩個所述主播公告的公告向量;
基于兩個所述主播公告的公告向量,獲得表征兩個主播之間主播公告相似度的第一度量值。
3.如權利要求2所述的方法,其特征在于,所述基于所述詞向量集,獲得兩個所述主播公告的公告向量,具體包括:
按照如下公式獲得公告向量:
其中,表示主播公告s的公告向量,表示主播公告s分詞后詞語的個數;表示詞語生成的向量;為常數;表示主播公告s中的詞語在所有主播公告中出現的詞頻。
4.如權利要求2所述的方法,其特征在于,所述基于所述多個主播的主播公告,獲得表征兩個主播之間主播公告相似度的第一度量值,具體包括:
按照如下公式獲得第一度量值:
,其中,表示兩個所述主播公告的公告向量;
所述基于所述多個主播的開播IP集合,獲得表征兩個主播之間開播IP集合相似度的第二度量值,具體包括:
按照如下公式獲得第二度量值:
,其中,表示兩個所述主播的開播IP集合;
所述基于所述多個主播的開播設備集合,獲得表征兩個主播之間開播設備集合相似度的第三度量值,具體包括:
按照如下公式獲得第三度量值:
,其中,表示兩個所述主播的開播設備集合。
5.如權利要求4所述的方法,其特征在于,所述基于所述第一度量值、第二度量值、第三度量值、正樣本集和負樣本集,獲得關于所述第一度量值、第二度量值和第三度量值的權重向量,具體包括:
基于所述第一度量值、第二度量值、第三度量值、正樣本集和負樣本集,構造如下公式:
,
其中,,表示權重向量;表示權重調節系數; 為變量,表示正樣本集S或負樣本集D中主播,
;
利用正樣本集和負樣本集,求解獲得使最小時的權重向量。
6.如權利要求1所述的方法,其特征在于,在將所述目標參量值大于預設閾值的兩個所述主播識別為目標主播之后,所述方法還包括:
對所述目標主播進行限制。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢斗魚魚樂網絡科技有限公司,未經武漢斗魚魚樂網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010584332.4/1.html,轉載請聲明來源鉆瓜專利網。





