[發(fā)明專利]一種機(jī)器彈幕用戶的識別方法、裝置、服務(wù)器和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201810896019.7 | 申請日: | 2018-08-08 |
| 公開(公告)號: | CN109086422B | 公開(公告)日: | 2021-02-02 |
| 發(fā)明(設(shè)計(jì))人: | 王璐;張文明;陳少杰 | 申請(專利權(quán))人: | 武漢斗魚網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62;H04N21/442;H04N21/4788;H04N21/488 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 430070 湖北省武漢市武漢東湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機(jī)器 彈幕 用戶 識別 方法 裝置 服務(wù)器 存儲 介質(zhì) | ||
本發(fā)明實(shí)施例公開了一種機(jī)器彈幕用戶的識別方法、裝置、服務(wù)器和存儲介質(zhì)。該方法包括:獲取各彈幕用戶對應(yīng)的彈幕特征信息和觀看信息;基于獲取的第一預(yù)設(shè)數(shù)量的重要彈幕特征種類,從各彈幕用戶對應(yīng)的彈幕特征信息中確定各彈幕用戶對應(yīng)的重要彈幕特征信息;將各彈幕用戶進(jìn)行兩兩組合,并根據(jù)各重要彈幕特征信息和各觀看信息,確定各組合中兩個(gè)彈幕用戶之間的用戶距離;根據(jù)預(yù)設(shè)聚類算法和各用戶距離,對各彈幕用戶進(jìn)行聚類,確定多個(gè)聚類用戶集;根據(jù)各聚類用戶集的用戶總數(shù)、對各聚類用戶標(biāo)記的用戶標(biāo)識、以及預(yù)設(shè)可疑閾值,確定機(jī)器彈幕用戶。本實(shí)施例的技術(shù)方案可以解決現(xiàn)有識別方法中存在的局限性和準(zhǔn)確度較低的問題,提高識別準(zhǔn)確度。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及數(shù)據(jù)處理技術(shù),尤其涉及一種機(jī)器彈幕用戶的識別方法、裝置、服務(wù)器和存儲介質(zhì)。
背景技術(shù)
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)視頻直播作為一種新型的娛樂方式,因直觀性和內(nèi)容豐富等特點(diǎn),受到了越來越多用戶的喜愛。通常,用戶在觀看直播的過程中,可以通過發(fā)送彈幕的方式與主播進(jìn)行互動,并且彈幕數(shù)量越多表示直播間的熱度越高。
目前,直播平臺中往往存在利用機(jī)器模仿真實(shí)用戶的方式來刷彈幕的舞弊行為,以增加直播間的熱度和人氣。為了杜絕這一舞弊行為,需要對發(fā)送彈幕的用戶進(jìn)行識別,確定是否存在機(jī)器彈幕用戶。
現(xiàn)有技術(shù)中,可以通過設(shè)置一些識別規(guī)則,根據(jù)明顯的異常特征來確定機(jī)器彈幕用戶。示例性的,將公用相同IP(Internet Protocol)地址的彈幕用戶確定為機(jī)器彈幕用戶。然而,通過識別規(guī)則只能識別出一些特征明顯的機(jī)器彈幕用戶,從而遺漏掉特征不明顯的機(jī)器彈幕用戶。針對于此,可以利用基于機(jī)器學(xué)習(xí)模型來識別那些特征不明顯的機(jī)器彈幕用戶,但由于機(jī)器學(xué)習(xí)模型的訓(xùn)練樣本有限,從而導(dǎo)致機(jī)器學(xué)習(xí)模型的識別準(zhǔn)確度較低,存在機(jī)器彈幕用戶誤判的情況。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種機(jī)器彈幕用戶的識別方法、裝置、服務(wù)器和存儲介質(zhì),以解決現(xiàn)有識別方法中存在的局限性和準(zhǔn)確度較低的問題,從而提高機(jī)器彈幕用戶的識別準(zhǔn)確度。
第一方面,本發(fā)明實(shí)施例提供了一種機(jī)器彈幕用戶的識別方法,包括:
獲取各彈幕用戶對應(yīng)的彈幕特征信息和觀看信息;
基于獲取的第一預(yù)設(shè)數(shù)量的重要彈幕特征種類,從所述各彈幕用戶對應(yīng)的彈幕特征信息中確定各所述彈幕用戶對應(yīng)的重要彈幕特征信息;
將所述各彈幕用戶進(jìn)行兩兩組合,并根據(jù)各所述重要彈幕特征信息和各所述觀看信息,確定各組合中兩個(gè)彈幕用戶之間的用戶距離;
根據(jù)預(yù)設(shè)聚類算法和各所述用戶距離,對所述各彈幕用戶進(jìn)行聚類,確定多個(gè)聚類用戶集;
根據(jù)各所述聚類用戶集的用戶總數(shù)、對各聚類用戶標(biāo)記的用戶標(biāo)識、以及預(yù)設(shè)可疑閾值,確定機(jī)器彈幕用戶,其中所述用戶標(biāo)識包括可疑標(biāo)識和真實(shí)標(biāo)識。
第二方面,本發(fā)明實(shí)施例還提供了一種機(jī)器彈幕用戶的識別裝置,包括:
用戶信息獲取模塊,用于獲取各彈幕用戶對應(yīng)的彈幕特征信息和觀看信息;
重要彈幕特征信息確定模塊,用于基于獲取的第一預(yù)設(shè)數(shù)量的重要彈幕特征種類,從所述各彈幕用戶對應(yīng)的彈幕特征信息中確定各所述彈幕用戶對應(yīng)的重要彈幕特征信息;
用戶距離確定模塊,用于將所述各彈幕用戶進(jìn)行兩兩組合,并根據(jù)各所述重要彈幕特征信息和各所述觀看信息,確定各組合中兩個(gè)彈幕用戶之間的用戶距離;
聚類用戶集確定模塊,用于根據(jù)預(yù)設(shè)聚類算法和各所述用戶距離,對所述各彈幕用戶進(jìn)行聚類,確定多個(gè)聚類用戶集;
機(jī)器彈幕用戶確定模塊,用于根據(jù)各所述聚類用戶集的用戶總數(shù)、對各聚類用戶標(biāo)記的用戶標(biāo)識、以及預(yù)設(shè)可疑閾值,確定機(jī)器彈幕用戶,其中所述用戶標(biāo)識包括可疑標(biāo)識和真實(shí)標(biāo)識。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢斗魚網(wǎng)絡(luò)科技有限公司,未經(jīng)武漢斗魚網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810896019.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





