[發(fā)明專利]一種基于大數(shù)據(jù)與神經(jīng)網(wǎng)絡(luò)的信息智能攔截方法在審
| 申請?zhí)枺?/td> | 202110103304.0 | 申請日: | 2021-01-26 |
| 公開(公告)號: | CN112905989A | 公開(公告)日: | 2021-06-04 |
| 發(fā)明(設(shè)計)人: | 駱利華;徐銳 | 申請(專利權(quán))人: | 杭州寬信科技有限公司 |
| 主分類號: | G06F21/45 | 分類號: | G06F21/45;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 杭州快知知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 33293 | 代理人: | 楊冬玲 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 神經(jīng)網(wǎng)絡(luò) 信息 智能 攔截 方法 | ||
本發(fā)明公開了一種基于大數(shù)據(jù)與神經(jīng)網(wǎng)絡(luò)的信息智能攔截方法,包括以下步驟:獲取待識別信息中第一目標(biāo)內(nèi)容的第一詞向量,將所述第一詞向量輸入神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,輸出所述第一目標(biāo)內(nèi)容的第一置信度;獲取垃圾信息中包含預(yù)設(shè)第二目標(biāo)內(nèi)容的概率,根據(jù)所述概率和所述第一置信度進(jìn)行模型訓(xùn)練,輸出所述待識別信息的第二置信度;獲取發(fā)送所述待識別信息的通訊方式的過往信用記錄,基于所述第二置信度和所述過往信用記錄判斷是否對所述待識別信息進(jìn)行攔截。本方法對包含網(wǎng)絡(luò)鏈接、第三方平臺賬號的信息進(jìn)行有效識別、降低漏攔概率的同時,減少對有些包含類垃圾信息關(guān)鍵詞的非垃圾信息以及一些玩笑類信息誤攔截現(xiàn)象的發(fā)生。
技術(shù)領(lǐng)域
本發(fā)明涉及通訊技術(shù)領(lǐng)域,尤其涉及一種基于大數(shù)據(jù)與神經(jīng)網(wǎng)絡(luò)的信息智能攔截方法。
背景技術(shù)
隨著網(wǎng)絡(luò)登錄與用戶身份認(rèn)證等安全性問題的不斷滲透,信息行業(yè)迎來了復(fù)蘇時期,2019年全國信息業(yè)務(wù)量比上年增長37.5%,增速提高了23.5個百分點,信息行業(yè)復(fù)蘇與互聯(lián)網(wǎng)的共同發(fā)展導(dǎo)致信息的內(nèi)容與種類不再是單一的形式,網(wǎng)絡(luò)鏈接、第三方平臺賬號、網(wǎng)絡(luò)用語等內(nèi)容出現(xiàn)在信息文本中,推銷信息、淘寶刷單、傳銷散播等形式也層出不窮,現(xiàn)如今的信息攔截大部分采用關(guān)鍵詞識別與匹配、信息中心黑名單匹配等技術(shù),對于包含網(wǎng)絡(luò)鏈接、第三方平臺賬號的信息不能進(jìn)行有效的攔截,存在一定的漏攔概率,同時,有些包含類垃圾信息關(guān)鍵詞的非垃圾信息以及一些玩笑類信息,采用當(dāng)前的信息攔截技術(shù)會發(fā)生誤攔截現(xiàn)象。
現(xiàn)有技術(shù)中通過獲取待識別信息的發(fā)送方身份信息和信息文本數(shù)據(jù);對關(guān)鍵詞集合進(jìn)行詞向量處理并輸入至關(guān)鍵詞模型中得到M個標(biāo)簽,計算關(guān)鍵詞標(biāo)簽與預(yù)設(shè)標(biāo)簽的匹配度,并根據(jù)設(shè)定的閾值進(jìn)行判斷得出信息的標(biāo)簽,根據(jù)該標(biāo)簽獲得信息的屬性,對于信息發(fā)送方信息為表征信息,如姓名、號碼、地址等,該信息識別方法能夠?qū)ΥR別信息進(jìn)行更為細(xì)致的標(biāo)識,也即,能夠?qū)ΥR別信息進(jìn)行更為細(xì)致的分類,通過對其更為細(xì)致的分類來提高分類的準(zhǔn)確率,但是還是存在如下缺陷:對于含有網(wǎng)絡(luò)鏈接、第三方平臺賬號的信息未進(jìn)行有效的攔截,只獲取發(fā)送方的姓名、號碼與地址,未對發(fā)送方發(fā)送信息次數(shù)與信用度進(jìn)行判斷,存在誤攔截的現(xiàn)象。
發(fā)明內(nèi)容
本發(fā)明提供的一種基于大數(shù)據(jù)與神經(jīng)網(wǎng)絡(luò)的信息智能攔截方法,旨在解決現(xiàn)有技術(shù)中對于信息中包含的網(wǎng)絡(luò)鏈接、第三方平臺賬號不能進(jìn)行有效攔截或?qū)π畔⑦M(jìn)行誤攔截的問題。
為實現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:
本發(fā)明的一種基于大數(shù)據(jù)與神經(jīng)網(wǎng)絡(luò)的信息智能攔截方法,包括以下步驟:
獲取待識別信息中第一目標(biāo)內(nèi)容的第一詞向量,將所述第一詞向量輸入神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,輸出所述第一目標(biāo)內(nèi)容的第一置信度;
獲取垃圾信息中包含預(yù)設(shè)第二目標(biāo)內(nèi)容的概率,根據(jù)所述概率和所述第一置信度進(jìn)行模型訓(xùn)練,輸出所述待識別信息的第二置信度;
獲取發(fā)送所述待識別信息的通訊方式的過往信用記錄,基于所述第二置信度和所述過往信用記錄判斷是否對所述待識別信息進(jìn)行攔截。
利用正則表達(dá)式進(jìn)行信息文本的語義分析,獲得關(guān)鍵詞、網(wǎng)絡(luò)鏈接、第三方平臺賬號的詞向量等語義特征,通過多層神經(jīng)網(wǎng)絡(luò)模型對語義特征進(jìn)行訓(xùn)練,快速的檢測與判斷信息是否為垃圾信息的置信度,降低了漏攔截的概率,同時結(jié)合大數(shù)據(jù)對發(fā)送該垃圾信息的通訊方式進(jìn)行發(fā)送垃圾信息次數(shù)和信用度的監(jiān)測,進(jìn)行綜合判定,減少誤攔截現(xiàn)象的發(fā)生。
作為優(yōu)選,獲取待識別信息中第一目標(biāo)內(nèi)容的第一詞向量,將所述第一詞向量輸入神經(jīng)網(wǎng)絡(luò)模型進(jìn)行并行訓(xùn)練,輸出所述第一目標(biāo)內(nèi)容的第一置信度,包括:
利用正則表達(dá)式對所述待識別信息進(jìn)行語義分析,獲取所述待識別信息中第一目標(biāo)內(nèi)容的第一詞向量,所述第一目標(biāo)內(nèi)容包含關(guān)鍵詞、網(wǎng)絡(luò)鏈接、第三方平臺賬號;
預(yù)設(shè)所述第二目標(biāo)內(nèi)容的第二詞向量,所述第二目標(biāo)內(nèi)容包含非法關(guān)鍵詞、非法網(wǎng)絡(luò)鏈接、非法第三方平臺賬號,將所述第一詞向量和第二詞向量輸入神經(jīng)網(wǎng)絡(luò)模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州寬信科技有限公司,未經(jīng)杭州寬信科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110103304.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計算機(jī)或計算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計算機(jī)系統(tǒng)或計算機(jī)網(wǎng)絡(luò)中的節(jié)點
G06F21-22 .通過限制訪問或處理程序或過程
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





