[發明專利]一種海關進出口商品稅號預測方法有效
| 申請號: | 202010744808.6 | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN111985204B | 公開(公告)日: | 2023-06-02 |
| 發明(設計)人: | 張強;周成杰;車超 | 申請(專利權)人: | 大連大學 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06N3/0464;G06N3/08;G06Q40/00 |
| 代理公司: | 大連智高專利事務所(特殊普通合伙) 21235 | 代理人: | 畢進 |
| 地址: | 116622 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 海關 進出口商品 預測 方法 | ||
本發明公開了一種海關進出口商品稅號預測方法,具體包括:步驟1:對海關進出口商品文本進行預處理,得到要素名稱和要素內容;步驟2:將步驟1中得到的要素內容進行拆分,然后利用輔助網絡進行差異性要素選擇;步驟3:把步驟2中得到的差異性要素送入CNN網絡中進行特征提取,同時利用DPCNN網絡提取要素名稱特征、SSCNN網絡提取要素內容特征。步驟4:融合步驟3中得到的差異性要素特征、要素名稱特征、要素內容特征,然后進行分類操作,進而得到商品稅號。本申請通過利用海關專有的語料資源,實現了在申報要素長短差異導致短要素特征稀釋的前提下對海關進出口商品文本進行稅號預測,提高了稅號預測的準確率。
技術領域
本發明涉及自然語言處理技術領域,具體涉及一種基于混合卷積神經網絡和輔助網絡的海關進出口商品稅號預測方法。
背景技術
海關稅收是很多國家稅收的主要來源。目前中國海關主要使用人工進行審核進出口商品的稅率,其能覆蓋海量的進出口商品的很少一部分。由于海關征稅的主要依據是商品的文本信息,使用自然語言處理技術對商品文本進行分類,根據類別確定稅收,可以實現稅收風險防控的自動化。商品的稅收預測可以轉化為一個中文文本分類問題。
中文文本分類,指將文本集(或其他實體或物件)按照一定的分類體系或標準進行自動分類標記的過程。它根據一個已經被標注的訓練文檔集合,找到文檔特征和文檔類別之間的關系模型,然后利用這種學習得到的關系模型對新的文檔進行類別判斷。現有的文本分類從基于知識的方法逐漸轉變為基于統計和機器學習的方法。很多分類模型在中文文本分類任務上取得了較為理想的效果,海關進出口申報文本相比較于普通中文,單條文本是由多個要素線性組成的,沒有連續的上下文語義。目前,利用人工智能進行海關進出口申報文本分類任務還沒有人嘗試,但是抽象成傳統的文本分類問題,麻省理工的Yoon?Kim提出的TextCNN卷積模型可以很好的提取文本特征,利用特征組合進行文本分類;谷歌提出的BERT模型利用大規模預訓練語料以及龐大的模型參數量,提高了文本分類任務的精度。但是對于海關進出口申報文本分類任務,由于海關文本存在的領域性及特殊性,普通模型在海關商品分類任務上效果表現欠佳。
發明內容
本申請的目的在于提供一種海關進出口商品稅號預測方法,通過利用海關專有的語料資源,實現了在申報要素長短差異導致短要素特征稀釋的前提下對海關進出口商品文本進行稅號預測,提高了稅號預測的準確率。
為實現上述目的,本申請的技術方案為:一種海關進出口商品稅號預測方法,具體包括:
步驟1:對海關進出口商品文本進行預處理,得到要素名稱和要素內容;
步驟2:將步驟1中得到的要素內容進行拆分,然后利用輔助網絡進行差異性要素選擇;
步驟3:把步驟2中得到的差異性要素送入CNN網絡中進行特征提取,同時利用DPCNN網絡提取要素名稱特征、SSCNN網絡提取要素內容特征。
步驟4:融合步驟3中得到的差異性要素特征、要素名稱特征、要素內容特征,然后進行分類操作,進而得到商品稅號。
進一步的,所述步驟2具體實現方式為:
步驟21.將得到的要素內容,把商品大類相同的數據聚集在一起形成一個段落;
步驟22.計算每個段落有多少個商品小類,依此把每各個段落送入輔助網絡中,針對商品小類進行分類訓練;在每個段落訓練時,按順序依次把要素內容變成要素名稱,得到每個要素的損失值;
步驟23.利用每個段落得到的各個要素的損失值,按照從大到小的順序,選擇出前2個差異性要素。
進一步的,所述步驟3具體實現方式為:
步驟31.將差異性要素,送入CNN網絡中利用卷積層提取特征,最大池化層進行特征稀疏;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連大學,未經大連大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010744808.6/2.html,轉載請聲明來源鉆瓜專利網。





