[發明專利]一種商品名稱校正方法、裝置和計算機可讀存儲介質在審
| 申請號: | 201910672294.5 | 申請日: | 2019-07-24 |
| 公開(公告)號: | CN110377801A | 公開(公告)日: | 2019-10-25 |
| 發明(設計)人: | 王加 | 申請(專利權)人: | 浙江諾諾網絡科技有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06Q30/04;G06Q40/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 史翠 |
| 地址: | 310000 浙江省杭州市西湖區雙龍街199號杭政*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 發票開具 分類編碼 目標標準 計算機可讀存儲介質 校正 稅收 編輯距離算法 接收用戶 商品類別 用戶提供 字段匹配 匹配度 匹配 數據庫 規范化 展示 保證 | ||
本發明實施例公開了一種商品名稱校正方法、裝置和計算機可讀存儲介質,接收用戶輸入的商品名稱;采用es字段匹配,從數據庫中獲取與商品名稱相對應的標準名稱;根據最小編輯距離算法,計算出商品名稱與各標準名稱之間的名稱得分;展示滿足得分要求的目標標準名稱及其對應的稅收分類編碼;其中,每個目標標準名稱及其對應的稅收分類編碼有對應的匹配度。用戶可以根據實際商品類別,選擇合適的目標標準名稱作為發票開具的商品名稱。通過向用戶提供規范化的標準名稱,可大幅提高發票開具的規范性,保證了發票開具時商品名稱的正確性。并且每個標準名稱有其對應的稅收分類編碼,提高了編碼匹配的準確性。
技術領域
本發明涉及智能編碼技術領域,特別是涉及一種商品名稱校正方法、裝置和計算機可讀存儲介質。
背景技術
商品和服務稅收分類與編碼是指在增值稅發票升級版中,納稅人開具發票時票面上的商品名稱應與稅務總局核定的稅收分類編碼進行關聯,按分類編碼上注明的稅率和征收率開具發票。
現有技術中借由大數據技術,通過用戶的使用習慣,包括分詞技術,語義分析,機器學習,將對應商品劃分至對應分類下,從而確定出商品名稱對應的稅收分類編碼。
由于商品種類繁雜,發票開具商品名稱較為隨意,時常會出現開票時商品名稱中存在錯字,命名不規范等問題。當商品名稱存在錯誤或者是不規范時,可能會匹配到錯誤的稅收分類編碼,導致編碼匹配錯誤率較高。
可見,如何提高編碼匹配的準確性,是本領域技術人員需要解決的問題。
發明內容
本發明實施例的目的是提供一種商品名稱校正方法、裝置和計算機可讀存儲介質,可以提高編碼匹配的準確性。
為解決上述技術問題,本發明實施例提供一種商品名稱校正方法,包括:
接收用戶輸入的商品名稱;
采用es字段匹配,從數據庫中獲取與所述商品名稱相對應的標準名稱;
根據最小編輯距離算法,計算出所述商品名稱與各標準名稱之間的名稱得分;
展示滿足得分要求的目標標準名稱及其對應的稅收分類編碼;其中,每個目標標準名稱及其對應的稅收分類編碼有對應的匹配度。
可選的,所述展示滿足得分要求的目標標準名稱及其對應的稅收分類編碼包括:
從所述標準名稱中篩選出名稱得分大于或等于預設閾值的目標標準名稱;
按照名稱得分降序的順序,展示各目標標準名稱及其對應的稅收分類編碼。
可選的,所述根據最小編輯距離算法,計算出所述商品名稱與各標準名稱之間的名稱得分包括:
根據所述商品名稱的字符長度和第一標準名稱的字符長度,確定出所述商品名稱與所述第一標準名稱的編輯距離;其中,第一標準名稱為所有標準名稱中的任意一個標準名稱;
按照如下公式,計算所述商品名稱與所述第一標準名稱之間的名稱得分,
其中,m表示預先設定的匹配度分值。
可選的,所述目標標準名稱及其對應的稅收分類編碼所對應的匹配度由用戶選擇得分以及認證得分確定得到。
可選的,在所述展示滿足得分要求的目標標準名稱及其對應的稅收分類編碼之后還包括:
在獲取到用戶選擇的標準名稱之后,將用戶選擇的標準名稱與所述商品名稱存儲到對應關系庫。
可選的,還包括:
在獲取到用戶輸入的新商品名稱之后,從對應關系庫中查找是否存在與所述新商品名稱相對應的標準名稱;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江諾諾網絡科技有限公司,未經浙江諾諾網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910672294.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種FC芯片數據發送方法及系統
- 下一篇:一種新增試題的知識點標注方法及系統





