[發(fā)明專利]涉網(wǎng)犯罪分類方法、裝置、計算機設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010738496.8 | 申請日: | 2020-07-28 |
| 公開(公告)號: | CN112070112B | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設(shè)計)人: | 丁偉杰;李海軍;沈旭晨;陳立力;李保敏 | 申請(專利權(quán))人: | 浙江警察學院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F40/30;G06N3/04;G06N3/08;G06Q50/26 |
| 代理公司: | 杭州知學知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 33356 | 代理人: | 張雯 |
| 地址: | 310053 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 犯罪 分類 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
1.涉網(wǎng)犯罪分類方法,其特征在于,包括:
獲取需要分析的犯罪案件信息,以得到初始數(shù)據(jù);
將所述初始數(shù)據(jù)輸入至案件分類模型內(nèi)進行案件分類處理,以得到分類結(jié)果;
反饋所述分類結(jié)果至終端,以在終端顯示;
其中,所述案件分類模型是通過帶有案件類別標簽的犯罪案件信息作為第一樣本數(shù)據(jù)集訓練文本分類模型所得的;
所述案件分類模型是通過帶有案件類別標簽的犯罪案件信息作為第一樣本數(shù)據(jù)集訓練文本分類模型所得的,包括:
構(gòu)建文本分類模型,并進行預訓練;
獲取若干個涉網(wǎng)犯罪案件信息以及若干個非涉網(wǎng)犯罪案件信息,并對涉網(wǎng)犯罪案件信息以及非涉網(wǎng)犯罪案件信息對應的案件類別標簽,以得到第一樣本數(shù)據(jù)集;
將第一樣本數(shù)據(jù)集劃分為第一訓練集以及第一測試集;
根據(jù)第一訓練集對文本分類模型進行微調(diào),以得到微調(diào)后的文本分類模型;
使用微調(diào)后的文本分類模型對第一測試集進行預測,以得到測試結(jié)果;選取公安警情數(shù)據(jù)中沒有明確標記為涉網(wǎng)或者非涉網(wǎng)的數(shù)據(jù)作為第一測試集:,其中代表實數(shù)域上的階矩陣,L代表訓練樣本的文本長度,E代表詞向量維度,使用微調(diào)后的BERT模型對測試數(shù)據(jù)進行預測,使用softmax函數(shù)計算得到第一測試集i屬于每一個涉網(wǎng)和非涉網(wǎng)的概率,選取最大概率值所對應的類別作為第一測試集i的預測類別;
判斷測試結(jié)果是否符合要求;
若測試結(jié)果符合要求,則微調(diào)后的文本分類模型為案件分類模型;
若測試結(jié)果不符合要求,則執(zhí)行所述根據(jù)第一訓練集對文本分類模型進行微調(diào),以得到微調(diào)后的文本分類模型;
所述根據(jù)第一訓練集對文本分類模型進行微調(diào),以得到微調(diào)后的文本分類模型,包括:
將第一訓練集輸入至文本分類模型內(nèi)進行計算,以得到樣本的語義向量;
使用全連接層對樣本的語義向量計算涉網(wǎng)新型犯罪案件類別以及非涉網(wǎng)新型犯罪案件類別所對應的語義特征,以得到特征值;
根據(jù)特征值計算涉網(wǎng)新型犯罪案件類別以及非涉網(wǎng)新型犯罪案件類別對應的概率,以得到訓練結(jié)果;
根據(jù)訓練結(jié)果以及對應的案件類別標簽計算交叉熵損失函數(shù)值,通過損失函數(shù)值進行反向傳播微調(diào)文本分類模型的參數(shù),以得到微調(diào)后的文本分類模型;
所述全連接層采用逐層減半并與上層向量拼接的方式進行逐層降維;具體地,采用輸入層進行維度減半,并輸入至第一隱藏層后得到的結(jié)果進行向量拼接,此后再進行維度減半,以得到第二隱藏層的輸入,后續(xù)的隱藏層均按照上述的維度減半后向量拼接的方式進行,最終計算得到輸入的警情案件文本分別屬于涉網(wǎng)案件和非涉網(wǎng)案件的語義特征向量。
2.根據(jù)權(quán)利要求1所述的涉網(wǎng)犯罪分類方法,其特征在于,所述文本分類模型包括通用預訓練語言表示模型、神經(jīng)網(wǎng)絡(luò)模型以及非神經(jīng)網(wǎng)絡(luò)中至少一種。
3.根據(jù)權(quán)利要求2所述的涉網(wǎng)犯罪分類方法,其特征在于,所述根據(jù)特征值計算涉網(wǎng)新型犯罪案件類別以及非涉網(wǎng)新型犯罪案件類別對應的概率,以得到訓練結(jié)果,包括:
根據(jù)特征值使用softmax函數(shù)計算涉網(wǎng)新型犯罪案件類別以及非涉網(wǎng)新型犯罪案件類別對應的概率,并選取概率值大的類別作為訓練結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江警察學院,未經(jīng)浙江警察學院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010738496.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





