[發(fā)明專利]一種識別目標主播的方法及系統(tǒng)、介質(zhì)、設備有效
| 申請?zhí)枺?/td> | 202010584332.4 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111488491B | 公開(公告)日: | 2020-10-16 |
| 發(fā)明(設計)人: | 王璐 | 申請(專利權(quán))人: | 武漢斗魚魚樂網(wǎng)絡科技有限公司 |
| 主分類號: | G06F16/78 | 分類號: | G06F16/78;G06F16/75;G06F40/289;H04N21/2187;H04N21/258 |
| 代理公司: | 北京眾達德權(quán)知識產(chǎn)權(quán)代理有限公司 11570 | 代理人: | 孫朝銳 |
| 地址: | 430000 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)軟件園東路*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識別 目標 方法 系統(tǒng) 介質(zhì) 設備 | ||
本發(fā)明公開了一種識別目標主播的方法,根據(jù)目標主播之間具有高度的相似性,因此,在獲得第一度量值、第二度量值和第三度量值的基礎(chǔ)上,通過由具有相同直播特征主播構(gòu)成的正樣本集和由具有不同直播特征主播構(gòu)成的負樣本集獲得的權(quán)重向量對第一度量值、第二度量值和第三度量值進行加權(quán),由此獲得的目標參量值能更準確的表征主播之間的相似度,因此,基于該目標參量值與預設閾值的關(guān)系識別目標主播的識別準確率更高,從而提供了一種準確的識別目標主播的方法,將這些目標主播準確識別出來,以便于對目標直主播進行限制,避免對網(wǎng)絡資源的多余占用。
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡直播技術(shù)領(lǐng)域,尤其涉及一種識別目標主播的方法及系統(tǒng)、介質(zhì)、設備。
背景技術(shù)
直播公會是管理運營主播的經(jīng)紀公司,一個直播公會旗下一般包括多個主播,如果主播加入了某個公會,那么按照規(guī)定,該主播不能再使用其他賬號代表其他公會進行直播。然而,有一些目標主播為了獲取多個公會的扶持和獎勵,使用小號在多個公會下進行直播,會異常占用網(wǎng)絡直播平臺的網(wǎng)絡資源。為了解決占用網(wǎng)絡資源的問題,需要將這些目標主播準確識別出來,以對目標主播進行限制。現(xiàn)有技術(shù)中,一般采用如下方法進行識別:采用實名認證,主播在開播時會和其注冊時認證的身份信息進行核對,但可以通過,虛假驗證等手段繞過;采用公用設備,若在一段時間內(nèi)使用了相同設備那么則識別為大小號,該方法僅僅考慮了設備維度,可能造成誤殺或者遺漏。因此,現(xiàn)有對目標主播的識別準確率低。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的識別目標主播的方法及系統(tǒng)。
一方面,本申請通過本申請的一實施例提供如下技術(shù)方案:
一種識別目標主播的方法,所述方法包括:
獲取多個主播的主播公告、開播IP集合和開播設備集合;
基于所述多個主播的主播公告,獲得表征兩個主播之間主播公告相似度的第一度量值;基于所述多個主播的開播IP集合,獲得表征兩個主播之間開播IP集合相似度的第二度量值;基于所述多個主播的開播設備集合,獲得表征兩個主播之間開播設備集合相似度的第三度量值;
基于所述多個主播的開播IP集合和開播設備集合,獲得由具有相同直播特征主播構(gòu)成的正樣本集和由具有不同直播特征主播構(gòu)成的負樣本集;
基于所述第一度量值、第二度量值、第三度量值、正樣本集和負樣本集,獲得關(guān)于所述第一度量值、第二度量值和第三度量值的權(quán)重向量;
基于所述第一度量值、第二度量值、第三度量值和所述權(quán)重向量,獲得表征兩個所述主播之間加權(quán)后的相似度的目標參量值;
將所述目標參量值大于預設閾值的兩個所述主播識別為目標主播。
可選的,所述基于所述多個主播的主播公告,獲得表征兩個主播之間主播公告相似度的第一度量值,具體包括:
將兩個所述主播的主播公告進行分詞,生成詞向量集;
基于所述詞向量集,獲得兩個所述主播公告的公告向量;
基于兩個所述主播公告的公告向量,獲得表征兩個主播之間主播公告相似度的第一度量值。
可選的,所述基于所述詞向量集,獲得兩個所述主播公告的公告向量,具體包括:
按照如下公式獲得公告向量:
其中,表示主播公告s的公告向量,表示主播公告s分詞后詞語的個數(shù);表示詞語生成的向量;為常數(shù);表示主播公告s中的詞語在所有主播公告中出現(xiàn)的詞頻。
可選的,所述基于所述多個主播的主播公告,獲得表征兩個主播之間主播公告相似度的第一度量值,具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢斗魚魚樂網(wǎng)絡科技有限公司,未經(jīng)武漢斗魚魚樂網(wǎng)絡科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010584332.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





