[發(fā)明專利]一種基于SVM文本分析的詐騙日志文本分析方法與系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010490624.1 | 申請日: | 2020-06-02 |
| 公開(公告)號: | CN111666412A | 公開(公告)日: | 2020-09-15 |
| 發(fā)明(設(shè)計)人: | 王中華;郝振江;劉志會;許高尚 | 申請(專利權(quán))人: | 國家計算機(jī)網(wǎng)絡(luò)與信息安全管理中心;天津市國瑞數(shù)碼安全系統(tǒng)股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62 |
| 代理公司: | 北京知聯(lián)天下知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11594 | 代理人: | 張陸軍 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 svm 文本 分析 詐騙 日志 方法 系統(tǒng) | ||
本發(fā)明屬于文本分析領(lǐng)域,特別涉及一種基于SVM文本分析的詐騙日志文本分析方法。該方法包括:使用手機(jī)號黑白灰名單對來日志文本號碼分析,生成名單權(quán)重;使用關(guān)鍵詞對日志文本分析,生成關(guān)鍵詞權(quán)重;使用SVM模型對日志文本分析,生成SVM模型權(quán)重;使用所述名單權(quán)重、關(guān)鍵詞權(quán)重和SVM模型權(quán)重綜合分析,生成詐騙日志文本權(quán)重,利用所述詐騙日志文本權(quán)重,對日志文本進(jìn)行判斷。本發(fā)明從日志文本來源上、日志文本本身內(nèi)容進(jìn)行綜合判斷,降低誤判率,提高了對日志文本的識別準(zhǔn)確率,節(jié)省時間。
技術(shù)領(lǐng)域
本發(fā)明屬于文本分析領(lǐng)域,特別涉及一種基于SVM文本分析的詐騙日志文本分析方法與系統(tǒng)。
背景技術(shù)
目前詐騙文本分析主要依靠關(guān)鍵詞過濾技術(shù)。文本中的語言和內(nèi)容也是日新月異,不斷變化。甚至出現(xiàn)了“公證處通知”的字樣,無法實(shí)現(xiàn)自動分析識別。目前實(shí)現(xiàn)文本自動分類的技術(shù)有很多,但是支持向量機(jī)(SVM)技術(shù)是當(dāng)今最流行,分類效果最好的技術(shù)之一。但是許多場景下,正常文本和詐騙文本非常相似,如一上大學(xué)的子女找父母要生活費(fèi)。僅使用文本分類并不能很好的判斷詐騙文本。
發(fā)明內(nèi)容
針對上述問題,本發(fā)明設(shè)計實(shí)現(xiàn)一種基于SVM文本分析的詐騙日志文本分析方法,包括:
使用手機(jī)號黑白灰名單對來日志文本號碼分析,生成名單權(quán)重;
使用關(guān)鍵詞對日志文本分析,生成關(guān)鍵詞權(quán)重;
使用SVM模型對日志文本分析,生成SVM模型權(quán)重;
使用所述名單權(quán)重、關(guān)鍵詞權(quán)重和SVM模型權(quán)重綜合分析,生成詐騙日志文本權(quán)重,利用所述詐騙日志文本權(quán)重,對日志文本進(jìn)行判斷。
進(jìn)一步地,所述手機(jī)號黑白灰名單包括白名單,灰名單和黑名單;
所述使用手機(jī)號黑白灰名單對來日志文本號碼分析包括:
使用所述白名單、灰名單和黑名單對來日志文本號碼分類;
根據(jù)所述分類,生成名單權(quán)重。
進(jìn)一步地,所述使用關(guān)鍵詞對日志文本分析,生成關(guān)鍵詞權(quán)重,包括:
判斷日志文本格式;
依據(jù)所述日志文本格式,利用關(guān)鍵詞生成關(guān)鍵詞權(quán)重。
進(jìn)一步地,所述使用SVM模型對日志文本分析,生成SVM模型權(quán)重包括:
建立SVM模型,使用所述SVM模型對日志文本分析,生成SVM模型權(quán)重。
進(jìn)一步地,所述建立SVM模型包括:
收集訓(xùn)練日志文本,對所述訓(xùn)練日志文本進(jìn)行特征提取,生成特征提取文本;
使用TF-IDF對所述特征提取文本進(jìn)行特征標(biāo)識,生成特征標(biāo)識文本;
對所述特征標(biāo)識文本歸一化,生成歸一化數(shù)據(jù);
使用SVM對歸一化數(shù)據(jù)進(jìn)行分類,建立SVM模型。
本發(fā)明還提供一種基于SVM文本分析的詐騙日志文本分析系統(tǒng),包括:
名單分析模塊,用于使用手機(jī)號黑白灰名單對來日志文本號碼分析,生成名單權(quán)重;
關(guān)鍵詞分析模塊,用于使用關(guān)鍵詞對日志文本分析,生成關(guān)鍵詞權(quán)重;
SVM分析模塊,用于使用SVM模型對日志文本分析,生成SVM模型權(quán)重;
綜合分析模塊,用于使用所述名單權(quán)重、關(guān)鍵詞權(quán)重和SVM模型權(quán)重綜合分析,生成詐騙日志文本權(quán)重;
判斷模塊,用于利用所述詐騙日志文本權(quán)重,對日志文本進(jìn)行判斷。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國家計算機(jī)網(wǎng)絡(luò)與信息安全管理中心;天津市國瑞數(shù)碼安全系統(tǒng)股份有限公司,未經(jīng)國家計算機(jī)網(wǎng)絡(luò)與信息安全管理中心;天津市國瑞數(shù)碼安全系統(tǒng)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010490624.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





