[發(fā)明專利]一種對(duì)取證數(shù)據(jù)進(jìn)行分析的方法、裝置及可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201811592331.3 | 申請(qǐng)日: | 2018-12-25 |
| 公開(公告)號(hào): | CN109726239A | 公開(公告)日: | 2019-05-07 |
| 發(fā)明(設(shè)計(jì))人: | 林文楷;周成祖;王海濱;鄢小征;魏煒途;陳云 | 申請(qǐng)(專利權(quán))人: | 廈門市美亞柏科信息股份有限公司 |
| 主分類號(hào): | G06F16/25 | 分類號(hào): | G06F16/25 |
| 代理公司: | 廈門福貝知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 35235 | 代理人: | 郝學(xué)江 |
| 地址: | 361000 福建省廈門市*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 取證 歸一化處理 數(shù)據(jù)提取 數(shù)據(jù)通過 抽取 存儲(chǔ) 可讀存儲(chǔ)介質(zhì) 輸出結(jié)果判斷 特征匹配引擎 數(shù)據(jù)庫(kù)方式 有效性校驗(yàn) 正則表達(dá)式 分析判斷 技術(shù)手段 交易數(shù)據(jù) 輸出結(jié)果 數(shù)據(jù)類型 文本內(nèi)容 文件方式 準(zhǔn)確度 識(shí)別率 引擎 分析 | ||
本發(fā)明公開了一種對(duì)取證數(shù)據(jù)進(jìn)行分析的方法,包括如下步驟:S1:對(duì)取證數(shù)據(jù)通過ETL技術(shù)抽取以數(shù)據(jù)庫(kù)方式存儲(chǔ)的數(shù)據(jù),通過python腳本抽取以文件方式存儲(chǔ)的數(shù)據(jù)得出內(nèi)容型數(shù)據(jù),對(duì)文本內(nèi)容中的數(shù)據(jù)通過正則表達(dá)式引擎或特征匹配引擎進(jìn)行提取得出內(nèi)容型數(shù)據(jù);S2:對(duì)內(nèi)容型數(shù)據(jù)進(jìn)行有效性校驗(yàn)、歸一化處理;S3:建立雙向LSTM模型對(duì)歸一化處理后的內(nèi)容型數(shù)據(jù)進(jìn)行處理得到最終的輸出結(jié)果,根據(jù)最終的輸出結(jié)果判斷取證數(shù)據(jù)是否屬于交易數(shù)據(jù)。根據(jù)不同的數(shù)據(jù)類型采用不同的技術(shù)手段進(jìn)行數(shù)據(jù)提取,因此可以提高數(shù)據(jù)提取的準(zhǔn)確度。并利用雙向LSTM模型對(duì)取證數(shù)據(jù)進(jìn)行分析判斷,有效提高數(shù)據(jù)的識(shí)別率。
技術(shù)領(lǐng)域
本發(fā)明涉及手機(jī)取證領(lǐng)域,具體涉及一種對(duì)取證數(shù)據(jù)進(jìn)行分析的方法、裝置及可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
近年來,我國(guó)經(jīng)濟(jì)領(lǐng)域的違法犯罪行為的案發(fā)率和涉案金額有了很大幅度的增加,經(jīng)濟(jì)違法犯罪行為己經(jīng)成為社會(huì)普遍關(guān)注的問題之一。這類違法活動(dòng)呈現(xiàn)以下幾個(gè)特點(diǎn):1、越來越智能化、專業(yè)化和隱蔽化;2、涉案領(lǐng)域廣泛且案情復(fù)雜;3、新型高智能違法類型大量涌現(xiàn),如互聯(lián)網(wǎng)金融行業(yè)犯罪集中爆發(fā)。如何快速、完整、準(zhǔn)確地提取涉嫌人員手機(jī)中的數(shù)據(jù),并對(duì)其進(jìn)行有效分析取證成為是否能治理這類違法活動(dòng)的工作重點(diǎn)。
由于該類群體的違法活動(dòng)越來越隱蔽,如以集資、發(fā)行股票、眾籌等各種名義從事違法活動(dòng),而且通過第三方電子平臺(tái)等手段進(jìn)行交易往來,通過傳統(tǒng)手段提取的違法團(tuán)伙的數(shù)據(jù),難以滿足實(shí)際需求。現(xiàn)有的技術(shù)包含以下不足:
1、完整性不足:完全依賴于已知模板來提取取證數(shù)據(jù),遇到新格式或未知格式的數(shù)據(jù)就無法提取相應(yīng)的交易數(shù)據(jù);
2、準(zhǔn)確性不高:無法自動(dòng)識(shí)別幣種、金額或交易類型等的關(guān)鍵要素,導(dǎo)致提取的數(shù)據(jù)準(zhǔn)確性不高。
因此,提出一種對(duì)取證數(shù)據(jù)進(jìn)行分析的方法對(duì)手機(jī)取證的數(shù)據(jù)進(jìn)行分析,以快速、完整、準(zhǔn)確地獲取有效的經(jīng)濟(jì)犯罪相關(guān)的數(shù)據(jù),以及時(shí)調(diào)查取證得到預(yù)警,幫助取證人員快速定位和深挖幕后組織者和經(jīng)營(yíng)者。
發(fā)明內(nèi)容
針對(duì)以上所述的手機(jī)取證數(shù)據(jù)完整性不足、準(zhǔn)確度不高等問題,本發(fā)明提出了一種對(duì)取證數(shù)據(jù)進(jìn)行分析的方法,包括如下步驟:
S1:對(duì)取證數(shù)據(jù)通過ETL技術(shù)抽取以數(shù)據(jù)庫(kù)方式存儲(chǔ)的數(shù)據(jù),通過python腳本抽取以文件方式存儲(chǔ)的數(shù)據(jù)得出內(nèi)容型數(shù)據(jù),對(duì)文本內(nèi)容中的數(shù)據(jù)通過正則表達(dá)式引擎或特征匹配引擎進(jìn)行提取得出內(nèi)容型數(shù)據(jù);根據(jù)不同的數(shù)據(jù)類型采用不同的技術(shù)手段進(jìn)行數(shù)據(jù)提取,因此可以提高數(shù)據(jù)提取的準(zhǔn)確度。
S2:對(duì)內(nèi)容型數(shù)據(jù)進(jìn)行有效性校驗(yàn)、歸一化處理;進(jìn)一步對(duì)提取的內(nèi)容型數(shù)據(jù)進(jìn)行處理,得到有效的數(shù)據(jù)。
S3:建立雙向LSTM模型對(duì)歸一化處理后的內(nèi)容型數(shù)據(jù)進(jìn)行處理得到最終的輸出結(jié)果,根據(jù)最終的輸出結(jié)果判斷取證數(shù)據(jù)是否屬于交易數(shù)據(jù)。
進(jìn)一步地,步驟S1中的正則表達(dá)式引擎包括DFA引擎、傳統(tǒng)型NFA引擎、POSIX NFA引擎。利用正則表達(dá)式通過事先定義好的一些特定字符、及這些特定字符的組合對(duì)字符串進(jìn)行過濾,具有非常強(qiáng)的靈活性、邏輯性和功能性。
進(jìn)一步地,步驟S1中的特征匹配引擎包括NPL引擎,用以對(duì)文本內(nèi)容中的數(shù)據(jù)進(jìn)行提取、智能分詞,并通過建立特征模板進(jìn)行匹配得到內(nèi)容型數(shù)據(jù)。特征匹配引擎運(yùn)行效率高,準(zhǔn)確度高。
更進(jìn)一步地,步驟S2中的有效性校驗(yàn)包括通過正則表達(dá)式對(duì)內(nèi)容型數(shù)據(jù)的屬性進(jìn)行校驗(yàn)。通過正則表達(dá)式進(jìn)行有效性驗(yàn)證簡(jiǎn)單方便、高效便捷。
更進(jìn)一步地,內(nèi)容型數(shù)據(jù)的屬性包括姓名、身份證號(hào)、銀行名稱、銀行卡類型、銀行卡號(hào)、交易對(duì)象、交易來源、交易卡號(hào)、交易類型、交易時(shí)間、交易金額、幣種、用途、交易余額。根據(jù)這些內(nèi)容型數(shù)據(jù)的屬性獲取相對(duì)應(yīng)的內(nèi)容型數(shù)據(jù)。所有內(nèi)容型數(shù)據(jù)包括短信、公眾號(hào)消息、第三方支付信息和通聯(lián)內(nèi)容等的數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門市美亞柏科信息股份有限公司,未經(jīng)廈門市美亞柏科信息股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811592331.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種取證數(shù)據(jù)隱蔽存儲(chǔ)的方法和裝置
- 一種基于多種取證方法混合的取證流程管理方法
- 電子取證方法、取證服務(wù)器、取證智能終端及取證系統(tǒng)
- 針對(duì)移動(dòng)終端的遠(yuǎn)程取證方法、裝置、移動(dòng)終端和系統(tǒng)
- 取證服務(wù)器、取證智能終端及取證系統(tǒng)
- 一種電子取證系統(tǒng)及方法
- 一種快速電子取證方法及系統(tǒng)
- 基于多個(gè)取證設(shè)備的手機(jī)內(nèi)容取證方法和系統(tǒng)
- 用于安卓應(yīng)用的實(shí)時(shí)取證的方法、裝置和電子設(shè)備
- 支持多種操作系統(tǒng)的取證方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 音頻再現(xiàn)裝置
- 周期函數(shù)自變量變換裝置、方法及應(yīng)用其的通信設(shè)備
- 采用DMA控制器進(jìn)行數(shù)據(jù)歸一化處理的方法
- 通過歸一化相關(guān)值進(jìn)行幀頭信號(hào)識(shí)別的方法及裝置
- 基于圖像檢測(cè)的車輛識(shí)別方法
- 一種異構(gòu)漏洞掃描器數(shù)據(jù)歸一化處理裝置及方法
- 一種平臺(tái)在軌標(biāo)定方法
- 實(shí)體歸一化處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種擬態(tài)歸一化裁決系統(tǒng)、方法及可讀存儲(chǔ)介質(zhì)
- 圖像處理裝置及其方法、顯示裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 成像裝置、數(shù)據(jù)提取方法以及數(shù)據(jù)提取程序
- 提取排版數(shù)據(jù)的方法及裝置
- 成像裝置、數(shù)據(jù)提取方法以及數(shù)據(jù)提取程序
- 數(shù)據(jù)提取系統(tǒng)和數(shù)據(jù)提取方法
- 獲取數(shù)據(jù)包的處理方法和裝置
- 數(shù)據(jù)提取方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)提取規(guī)則的確定方法、裝置、計(jì)算機(jī)設(shè)備和介質(zhì)
- 一種報(bào)文數(shù)據(jù)提取方法及裝置
- 用于數(shù)據(jù)提取的方法、裝置及設(shè)備
- 通過電力線的數(shù)據(jù)通信
- 數(shù)據(jù)通過型分支、分配器
- 刪除數(shù)據(jù)通道的方法和裝置
- 一種航模遙控接收裝置中擴(kuò)展數(shù)據(jù)通道的方法
- 一種數(shù)據(jù)通信方法、裝置以及系統(tǒng)
- 數(shù)據(jù)通過網(wǎng)格網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的傳輸
- 用于安全數(shù)據(jù)訪問的系統(tǒng)、方法和計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 通過環(huán)回?cái)?shù)據(jù)通路提供CMB
- 數(shù)據(jù)通信優(yōu)化方法及數(shù)據(jù)通信優(yōu)化器
- 數(shù)據(jù)傳輸?shù)姆椒ā⒀b置、終端及存儲(chǔ)介質(zhì)





