[發(fā)明專(zhuān)利]數(shù)據(jù)異常檢測(cè)方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201910506329.8 | 申請(qǐng)日: | 2019-06-12 |
| 公開(kāi)(公告)號(hào): | CN110245132A | 公開(kāi)(公告)日: | 2019-09-17 |
| 發(fā)明(設(shè)計(jì))人: | 程雅慧 | 申請(qǐng)(專(zhuān)利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G06F16/215 | 分類(lèi)號(hào): | G06F16/215;G06F16/2458;G06K9/62 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專(zhuān)利商標(biāo)代理有限公司 44224 | 代理人: | 陳小娜 |
| 地址: | 518000 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)簇 待檢測(cè)數(shù)據(jù) 數(shù)據(jù)樣本 異常數(shù)據(jù) 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) 檢測(cè) 計(jì)算機(jī)設(shè)備 準(zhǔn)確度 非相似度 數(shù)據(jù)異常 相似度 相似度確定 異常狀態(tài) 申請(qǐng) | ||
1.一種數(shù)據(jù)異常檢測(cè)方法,包括:
獲取待檢測(cè)數(shù)據(jù),所述待檢測(cè)數(shù)據(jù)中包括至少兩個(gè)數(shù)據(jù)簇,所述每個(gè)數(shù)據(jù)簇中包括多個(gè)數(shù)據(jù)樣本;
計(jì)算數(shù)據(jù)簇內(nèi)各個(gè)數(shù)據(jù)樣本之間的相似度,根據(jù)所述各個(gè)數(shù)據(jù)樣本之間的相似度確定各個(gè)數(shù)據(jù)簇對(duì)應(yīng)的非相似數(shù)據(jù)樣本對(duì);
獲取各個(gè)數(shù)據(jù)簇對(duì)應(yīng)的非相似閾值,根據(jù)所述非相似閾值和所述非相似數(shù)據(jù)樣本對(duì)確定各個(gè)數(shù)據(jù)簇的狀態(tài);所述非相似閾值是根據(jù)數(shù)據(jù)簇內(nèi)的數(shù)據(jù)樣本數(shù)量確定的;
將異常狀態(tài)的數(shù)據(jù)簇對(duì)應(yīng)的數(shù)據(jù)作為所述待檢測(cè)數(shù)據(jù)中的異常數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
根據(jù)各個(gè)數(shù)據(jù)簇中的數(shù)據(jù)樣本計(jì)算各個(gè)數(shù)據(jù)簇之間的相似度,得到各個(gè)數(shù)據(jù)簇對(duì)相似度;
根據(jù)所述各個(gè)數(shù)據(jù)簇對(duì)相似度和預(yù)設(shè)相似閾值,確定各個(gè)數(shù)據(jù)簇對(duì)的狀態(tài);
將異常狀態(tài)的數(shù)據(jù)簇對(duì)對(duì)應(yīng)的數(shù)據(jù)作為所述待檢測(cè)數(shù)據(jù)中的異常數(shù)據(jù),所述異常狀態(tài)的數(shù)據(jù)簇對(duì)是指數(shù)據(jù)簇對(duì)對(duì)應(yīng)的數(shù)據(jù)簇對(duì)相似度超過(guò)預(yù)設(shè)相似度閾值。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)每個(gè)數(shù)據(jù)簇中的數(shù)據(jù)樣本計(jì)算數(shù)據(jù)簇之間的相似度,得到數(shù)據(jù)簇對(duì)相似度,包括:
獲取每個(gè)數(shù)據(jù)簇中每個(gè)數(shù)據(jù)樣本的質(zhì)量評(píng)價(jià)信息;
根據(jù)所述質(zhì)量評(píng)價(jià)信息分別從每個(gè)數(shù)據(jù)簇中選取預(yù)設(shè)數(shù)量的數(shù)據(jù)樣本,得到每個(gè)數(shù)據(jù)簇對(duì)應(yīng)的目標(biāo)數(shù)據(jù)樣本;
計(jì)算每個(gè)數(shù)據(jù)簇對(duì)應(yīng)的目標(biāo)數(shù)據(jù)樣本之間的相似度,根據(jù)所述每個(gè)數(shù)據(jù)簇對(duì)應(yīng)的目標(biāo)數(shù)據(jù)樣本之間的相似度確定數(shù)據(jù)簇對(duì)相似度。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述計(jì)算每個(gè)數(shù)據(jù)簇對(duì)應(yīng)的目標(biāo)數(shù)據(jù)樣本之間的相似度,根據(jù)所述每個(gè)數(shù)據(jù)簇對(duì)應(yīng)的目標(biāo)數(shù)據(jù)樣本之間的相似度確定數(shù)據(jù)簇對(duì)相似度,包括:
獲取第一數(shù)據(jù)簇對(duì)應(yīng)的第一目標(biāo)數(shù)據(jù)樣本和第二數(shù)據(jù)簇對(duì)應(yīng)的第二目標(biāo)數(shù)據(jù)樣本;
計(jì)算所述第一目標(biāo)數(shù)據(jù)樣本中每個(gè)數(shù)據(jù)樣本與第二目標(biāo)數(shù)據(jù)樣本中每個(gè)數(shù)據(jù)樣本的各個(gè)目標(biāo)相似度;
統(tǒng)計(jì)所述目標(biāo)相似度總數(shù)和所述目標(biāo)相似度超過(guò)預(yù)設(shè)目標(biāo)閾值的目標(biāo)相似度數(shù);
根據(jù)所述目標(biāo)相似度總數(shù)和目標(biāo)相似度數(shù)計(jì)算得到所述第一數(shù)據(jù)簇和所述第二數(shù)據(jù)簇對(duì)應(yīng)的數(shù)據(jù)簇對(duì)相似度。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,獲取各個(gè)數(shù)據(jù)簇中數(shù)據(jù)樣本的質(zhì)量評(píng)價(jià)信息,包括:
獲取所述各個(gè)數(shù)據(jù)簇中的數(shù)據(jù)樣本,將所述數(shù)據(jù)樣本輸入到已訓(xùn)練的質(zhì)量評(píng)價(jià)模型中進(jìn)行識(shí)別,得到輸出結(jié)果;
根據(jù)輸出結(jié)果得到所述各個(gè)數(shù)據(jù)簇中數(shù)據(jù)樣本的質(zhì)量評(píng)價(jià)信息。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取待檢測(cè)數(shù)據(jù),所述待檢測(cè)數(shù)據(jù)中包括至少兩個(gè)數(shù)據(jù)簇,所述每個(gè)數(shù)據(jù)簇中包括多個(gè)數(shù)據(jù)樣本,包括:
獲取原始數(shù)據(jù),將所述原始數(shù)據(jù)進(jìn)行劃分,得到各個(gè)目標(biāo)原始數(shù)據(jù);
使用聚類(lèi)算法對(duì)各個(gè)目標(biāo)原始數(shù)據(jù)分別進(jìn)行聚類(lèi),得到各個(gè)目標(biāo)原始數(shù)據(jù)對(duì)應(yīng)的多個(gè)原始數(shù)據(jù)簇;
計(jì)算所述多個(gè)原始數(shù)據(jù)簇之間的相似度,根據(jù)所述多個(gè)原始數(shù)據(jù)簇之間的相似度將所述多個(gè)原始數(shù)據(jù)簇進(jìn)行合并,得到所述至少兩個(gè)數(shù)據(jù)簇。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述計(jì)算數(shù)據(jù)簇內(nèi)各個(gè)數(shù)據(jù)樣本之間的相似度,根據(jù)所述各個(gè)數(shù)據(jù)樣本之間的相似度確定各個(gè)數(shù)據(jù)簇對(duì)應(yīng)的非相似數(shù)據(jù)樣本對(duì),包括:
提取所述數(shù)據(jù)簇內(nèi)各個(gè)數(shù)據(jù)樣本的特征;
根據(jù)所述數(shù)據(jù)樣本的特征使用相似度算法計(jì)算所述數(shù)據(jù)簇內(nèi)各個(gè)數(shù)據(jù)樣本之間的相似度;
將所述數(shù)據(jù)簇內(nèi)各個(gè)數(shù)據(jù)樣本之間的相似度未超過(guò)預(yù)設(shè)相似度閾值的數(shù)據(jù)樣本對(duì)作為非相似數(shù)據(jù)樣本對(duì)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,提取所述各個(gè)數(shù)據(jù)樣本對(duì)中數(shù)據(jù)樣本的特征,包括:
獲取已訓(xùn)練的數(shù)據(jù)識(shí)別模型,將所述各個(gè)數(shù)據(jù)樣本對(duì)中數(shù)據(jù)樣本輸入到所述已訓(xùn)練的數(shù)據(jù)識(shí)別模型中,得到特征提取層的輸出結(jié)果;
根據(jù)所述特征提取層的輸出結(jié)果得到所述各個(gè)數(shù)據(jù)樣本對(duì)中數(shù)據(jù)樣本的特征。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910506329.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種圖像數(shù)據(jù)的內(nèi)存管理方法及裝置
- 無(wú)線傳感器網(wǎng)絡(luò)中數(shù)據(jù)不間斷傳輸?shù)姆椒?/a>
- 無(wú)線傳感器簇形網(wǎng)絡(luò)中基于時(shí)空關(guān)聯(lián)的離群數(shù)據(jù)檢測(cè)方法
- 無(wú)線傳感器網(wǎng)絡(luò)的數(shù)據(jù)分層傳輸方法及裝置
- 一種基于不等分簇傳感器網(wǎng)絡(luò)的數(shù)據(jù)融合收集方法
- 一種基于LEACH協(xié)議的無(wú)線傳感器網(wǎng)絡(luò)路由方法
- 噪聲點(diǎn)檢測(cè)方法及裝置
- 數(shù)據(jù)處理方法及裝置、處理器、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于頻率改進(jìn)的聚類(lèi)方法
- 數(shù)據(jù)聚簇方法、裝置和計(jì)算機(jī)設(shè)備
- 一種電力系統(tǒng)中設(shè)備自動(dòng)定檢方法和故障錄波裝置
- 一種異常數(shù)據(jù)檢測(cè)的方法、裝置及設(shè)備
- 數(shù)據(jù)一致性的檢測(cè)方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 數(shù)據(jù)處理方法和裝置
- 信息檢測(cè)的方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 區(qū)塊鏈數(shù)據(jù)檢測(cè)方法、裝置及設(shè)備
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種基于安全基線模型的數(shù)據(jù)安全檢測(cè)方法及系統(tǒng)
- 一種異常用戶行為檢測(cè)方法和裝置
- 一種數(shù)據(jù)庫(kù)腳本檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 生物樣本庫(kù)應(yīng)用管理系統(tǒng)
- 一種數(shù)據(jù)樣本集合中異常點(diǎn)的檢測(cè)方法和裝置
- 數(shù)據(jù)收集方法及裝置
- 一種模型訓(xùn)練方法及裝置
- 一種評(píng)價(jià)尺度穩(wěn)定的數(shù)據(jù)標(biāo)記分配、統(tǒng)計(jì)的方法及系統(tǒng)
- 情報(bào)數(shù)據(jù)處理的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 異常數(shù)據(jù)檢測(cè)方法與裝置
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)融合方法及裝置
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 一種面向基礎(chǔ)地理信息異常數(shù)據(jù)的挖掘方法
- 一種微電阻率掃描成像測(cè)井?dāng)?shù)據(jù)異常校正方法及裝置
- 一種Flash播放器異常日志管理方法及系統(tǒng)
- 一種異常數(shù)據(jù)指標(biāo)分析的方法及裝置
- 數(shù)據(jù)回收方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種網(wǎng)絡(luò)流量數(shù)據(jù)分析方法及系統(tǒng)
- 異常數(shù)據(jù)的分析方法及異常數(shù)據(jù)分析平臺(tái)
- 一種基于電子圍網(wǎng)的異常數(shù)據(jù)優(yōu)化方法、裝置及電子設(shè)備
- 一種異常導(dǎo)入數(shù)據(jù)的處理方法、裝置及設(shè)備
- 管網(wǎng)檢測(cè)數(shù)據(jù)異常判斷方法及系統(tǒng)





