[發明專利]一種將非標準型號字符串映射為標準型字符串的方法在審
| 申請號: | 202011047910.7 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112131838A | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 朱宏寬 | 申請(專利權)人: | 無錫醫邁德科技有限公司 |
| 主分類號: | G06F40/151 | 分類號: | G06F40/151 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 214135 江蘇省無錫市新吳區菱*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 非標準 型號 字符串 映射 標準型 方法 | ||
本發明涉及計算機字符文本處理領域技術領域,具體涉及一種將非標準型號字符串映射為標準型號字符串的方法,旨在解決現有技術中由于手工填報內容復雜,信息系統的管理工作麻煩形成的問題,其技術要點在于:包含以下步驟:約定標準型號的集合S;約定非標準型號的集合E;建立從E中的元素到S中元素的映射關系;將所述集合S與所述集合E合并形成集合Z;將集合Z進行排序,在集合Z中找到與需要映射的非標準型號字符串k最相似的元素;取用最相似的元素z,如果z是集合S的元素而非集合E的元素,就直接返回z;如果z是集合E中的元素,則利用步驟3中的映射關系將z映射為S中的元素然后返回。
技術領域
本發明涉及計算機字符文本處理技術領域,具體涉及一種將非標準型號字符串映射為標準型字符串的方法。
背景技術
通常實物商品/產品都有自己的型號代碼,這種代碼代表著產品的具體原型,具有相同型號代碼的商品屬于同一種商品。在實際的供應鏈管理中,特別是在商品的銷售出庫、入庫、庫存、運輸、發票等具體環節中都會記錄商品的型號代碼。由于實際條件的限制,需要各個環節的工作人員手工填寫商品的型號代碼,或者在各種信息管理系統中填報商品的型號代碼。
對于某一生產廠家來說,其生產產品的型號代碼是一個有限的集合,這是因為其生產的產品的種類不可能有無限多種,將這個有限集合中的型號代碼稱為標準型號代碼。在實際業務中,因為有很多環節需要工作人員手工填報,由于各種各樣的原因,手工填報會出現很多的非標準型號,即手工填報的型號代碼不是標準型號代碼。
由于手工填報內容五花八門,給信息系統的管理工作造成了很多麻煩。現有的技術方案是通過去除部分字符(例如,中文,特殊符號+,-,逗號等)嘗試將非標準型號的字符串轉換為標準型號的字符串。但是常常碰到困難,例如有的型號代碼中就存在+-符號,所以效果并不好。
發明內容
因此,本發明要解決的技術問題在于克服現有技術中由于手工填報內容復雜,信息系統的管理工作麻煩形成的缺陷,從而提供一種將非標準型號字符串映射為標準型號字符串的方法。
本發明的上述技術目的是通過以下技術方案得以實現的:
一種將非標準型號字符串映射為標準型字符串的方法,包含以下步驟:
步驟一:約定標準型號的集合S,所述S中的元素為字符串;
步驟二:約定非標準型號的集合E,所述E中的元素為字符串;
步驟三:建立集合從E中的元素到S中元素的映射關系;
步驟四:將所述集合S與所述集合E合并形成集合Z;
步驟五:將集合Z進行排序,
步驟六:對于需要映射的非標準型號字符串k,在集合Z中找到與所述k最相似的元素,如果找不到,則返回INVALID,算法結束,找到最相似的元素后進入下一步驟;
步驟七:取用步驟六中得到的與k最相似的元素z,如果z是所述集合S的元素而非集合E的元素,就直接返回z;如果z是集合E中的元素,則利用步驟3中的映射關系將z映射為S中的元素然后返回。
在本申請的一些實施方式中,所述步驟五中對所述集合Z排序的準則為按照字符串的長度從高到低排序。
在本申請的一些實施方式中,所述步驟六的具體步驟為:按照步驟五中的排序從前到后取Z中的元素賦值給字符串z,并檢查z是否是字符串k的子串;
如果z為k的子串,則進入步驟七;
如果z不是k的子串,使用Needleman_Wunsch算法計算非標準型號字符串k與Z中任一元素z之間的匹配分值,如果匹配分值小于門限值,則返回INVALID,算法結束;否則,進入步驟七。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫醫邁德科技有限公司,未經無錫醫邁德科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011047910.7/2.html,轉載請聲明來源鉆瓜專利網。





