[發明專利]一種海關數據風控類型識別方法、海關智能化風險布控方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202110232188.2 | 申請日: | 2021-03-02 |
| 公開(公告)號: | CN112966131B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 王正剛;劉偉;金瑾 | 申請(專利權)人: | 中華人民共和國成都海關;中科院成都信息技術股份有限公司 |
| 主分類號: | G06F16/51 | 分類號: | G06F16/51;G06F16/55;G06F16/583;G06K9/62;G06N3/04;G06Q50/26 |
| 代理公司: | 成都頂峰專利事務所(普通合伙) 51224 | 代理人: | 楊國瑞 |
| 地址: | 610000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 海關 數據 類型 識別 方法 智能化 風險 布控 裝置 計算機 設備 存儲 介質 | ||
1.一種海關數據風控類型識別方法,其特征在于,包括識別模型訓練階段和風控類型識別階段;
所述識別模型訓練階段,包括有如下步驟S101~S106:
S101.獲取M條海關數據記錄信息,其中,所述海關數據記錄信息包含有查驗結果代碼和與N個數據項一一對應的N個數據內容,M為不小于3000的自然數,N為不小于64的自然數;
S102.針對所述N個數據項中的各個數據項,對相應的M個數據內容進行去重處理,然后對得到的至少一個數據內容進行索引編號,得到相應的數據字典,其中,所述數據字典記錄有所述至少一個數據內容與至少一個索引值的一一對應關系;
S103.針對所述M條海關數據記錄信息中的各條海關數據記錄信息,根據與相應的N個數據內容一一對應的N個所述數據字典且在所述數據字典中數據內容與索引值的一一對應關系,將相應的N個數據內容替換為索引值,然后將索引值編碼為紅綠藍RGB三通道顏色值,得到包含有N個RGB值的海關數據樣本,并將相應的查驗結果代碼標記為所述海關數據樣本的風控類型;
S104.從M個海關數據樣本中抽取m個海關數據樣本作為訓練樣本,得到訓練樣本集,其中,m為不小于2000的自然數,并使m/M介于0.6~0.8之間;
S105.針對所述訓練樣本集中的各個海關數據樣本,根據相應的N個RGB值,繪制得到像素矩陣為n*n的初始樣本圖像,然后對所述初始樣本圖像進行縮放處理,得到具有標準尺寸大小的訓練樣本圖像,其中,n為不小于的自然數;
S106.將所有訓練樣本圖像及對應的風控類型輸入蝶形反饋神經網絡BF-net模型進行訓練,并在訓練過程中出現訓練集準確率達到預設高值區間且變化幅度小于預設幅度閾值的情況時,采用自適應梯度AdaGrad算法調整學習率,然后繼續訓練,直到學習率調整幅度小于預設調整閾值時,停止訓練,得到完成訓練的BF-net模型,其中,所述BF-net模型的神經網絡結構包括有依次串聯的K個蝶形反饋塊、全連接層和輸出層,所述K個蝶形反饋塊中各個蝶形反饋塊分別包含有塊輸入層、左路第一卷積層、左路第二卷積層、右路第一卷積層、右路第二卷積層和塊輸出層,所述塊輸入層分別連接所述左路第一卷積層、所述右路第一卷積層和所述塊輸出層,所述左路第一卷積層連接所述左路第二卷積層且采用線性整流ReLu函數作為所述左路第二卷積層的激活函數,所述右路第一卷積層連接所述右路第二卷積層且也采用線性整流ReLu函數作為所述右路第二卷積層的激活函數,所述左路第二卷積層和所述右路第二卷積層分別連接所述塊輸出層,所述塊輸出層用于對收到的多個圖像素據進行相加處理并輸出相加結果,K為介于16~32之間的自然數,所述輸出層采用歸一化指數Softmax函數;
所述風控類型識別階段,包括有如下步驟S201~S204:
S201.獲取與報關貨物對應的待檢海關數據,其中,所述待檢海關數據包含有與所述N個數據項一一對應的N個待檢的數據內容;
S202.根據與所述N個待檢的數據內容一一對應的N個所述數據字典且在所述數據字典中數據內容與索引值的一一對應關系,將所述N個待檢的數據內容替換為索引值,然后將索引值編碼為紅綠藍RGB三通道顏色值,得到包含有N個RGB值的待檢數據;
S203.根據所述待檢數據的N個RGB值,繪制得到像素矩陣為n*n的初始待檢圖像,然后對所述初始待檢圖像進行縮放處理,得到具有標準尺寸大小的待檢圖像;
S204.將所述待檢圖像輸入所述完成訓練的BF-net模型進行識別,得到所述待檢海關數據的風控類型識別結果。
2.如權利要求1所述的海關數據風控類型識別方法,其特征在于,在所述K個蝶形反饋塊的串聯方向上,使首個蝶形反饋塊的塊輸入層分別連接第2k個蝶形反饋塊的塊輸出層,其中,k=1,2,3,…且使2k不大于K。
3.如權利要求1所述的海關數據風控類型識別方法,其特征在于,在所述步驟S104之后且所述步驟S105之前,所述方法還包括:
針對各個風控類型,判斷所述訓練樣本集中的對應訓練樣本數是否小于預設樣本數閾值,若是,則采用合成少數過采樣技術SMOTE算法對訓練樣本進行數據均衡處理,得到訓練樣本數增加的訓練樣本集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中華人民共和國成都海關;中科院成都信息技術股份有限公司,未經中華人民共和國成都海關;中科院成都信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110232188.2/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





