[發明專利]一種電子證據分類提取方法及系統有效
| 申請號: | 201611120337.1 | 申請日: | 2016-12-08 |
| 公開(公告)號: | CN106650799B | 公開(公告)日: | 2019-05-31 |
| 發明(設計)人: | 高敏;江圣航;熊志海 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 50102 | 代理人: | 白小清 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電子 證據 分類 提取 方法 系統 | ||
1.一種電子證據分類提取方法,其特征在于,包括步驟,電子證據獲取模塊調用RDD序列化存儲函數讀取電子數據,對電子數據進行歸一化處理獲得標稱電子數據集構成測試集;分類訓練模塊將訓練集中的樣本數據轉化為樣本特征和標簽,獲得標引的電子證據樣本集,該樣本集中的所有樣本數據獲得標簽,將獲得標簽的樣本數據輸入基分類器進行訓練,獲得電子證據分類器;將測試集中的電子數據輸入電子證據分類器進行聚類,為測試集中每個電子數據尋找對應的標簽,并分配到與其標簽對應的內存分布式數據集RDD分區中,對每個RDD分區進行簇排序,即獲得所有核心點的隊列,得到不同層次結構上的簇號,合并分區,為每個分區保存一個標簽,排除電子數據中的噪聲信息,輸出聚類結果;模糊融合識別模塊對經過聚類到各RDD分區的電子數據進行模糊識別,獲得分類電子證據;文檔層處理模塊從RDD各分區中拷貝分類電子證據形成目標數據,對目標數據進行文檔化處理,送入呈述層模塊,呈述層模塊對目標數據進行相關描述,自動生成描述型句子。
2.根據權利要求1所述的方法,其特征在于,所述分配到與其標簽對應的RDD分區中具體包括,將標稱電子數據集通過map鍵值對函數轉化為對應的鍵值對的形式,根據鍵值對將標稱電子數據集分配到一系列的RDD分區中。
3.根據權利要求1所述的方法,其特征在于,所述對每個RDD分區進行簇排序進一步具體包括:選擇一個電子數據樣本點放入全局鄰居數組,在全局鄰居數組中選擇第一個對象p進行擴張,判斷對象p是否為核心點,如果p不是核心點,從全局鄰居數組中刪除p;如果p是核心點,對核心點p的鄰域內任一未處理的鄰居點q計算歐式距離,如果q已在全局鄰居數組中且從p 到q 的可達距離小于此時q的歐式距離, 更新q 的可達距離為q的歐式距離, 并根據更新的可達距離,調整q 到全局鄰居數組中的相應位置;如果q不在全局鄰居數組中,則根據p到q 的可達距離將其插入有序隊列中,直到核心點p的所有鄰居點都插入隊列,獲得所有核心點的隊列即為分區的簇排序。
4.根據權利要求1所述的方法,其特征在于,所述所有樣本數據獲得標簽進一步包括:將訓練集中的樣本數據轉化為樣本特征和標簽(1,featuress,labels)的形式,采用廣播變量的形式將樣本特征和標簽進行分離,對特征進行廣播變量,將特征和標簽(1,featuress,labels)轉化為特征(1,featuress),標簽(1,1,label1),(1,2,label2),(1,3,label3),……(1,n*(n+1)/2,labeln*(n+1)/2),轉化獲得的標簽分配到n*(n+1)/2個RDD分區中,為每個分區保存一個標簽,其中,n表示標簽的維數。
5.根據權利要求1所述的方法,其特征在于,所述模糊識別具體包括,模糊融合識別模塊將電子數據對比度值域區間非線性劃分,提取特征,利用模糊隸屬函數獲取待分類電子證據樣本特征隸屬于各類別的卡方距離,對卡方距離內的各特征進行權重融合,獲得分類結果。
6.根據權利要求2所述的方法,其特征在于,根據任意RDD分區的前邊界數據樣本和廣播變量的后邊界點獲得鍵值對map,根據map的方向向前合并簇號,所有RDD分區中的標稱數據樣本點都根據鍵值對Map合并簇號,并輸出所有標稱電子數據對應的簇號,合并的簇號加入map中。
7.根據權利要求1所述的方法,其特征在于,呈述層模塊根據特征信息進行完整性檢查,獲取完整性程度高的電子證據,根據經過完整性檢查的特征信息生成固定長度的特征向量,利用投影矩陣將特征向量對應描述句子中的詞映射到相同的特征空間獲得詞序列特征向量,利用電子證據特征向量和對應的詞序列特征向量作為訓練樣本對訓練長短期記憶模型生成語言模型,將經過分類的電子證據輸入語言模型,自動生成描述型句子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611120337.1/1.html,轉載請聲明來源鉆瓜專利網。





