[發明專利]一種物品分類方法及裝置在審
| 申請號: | 202010037908.5 | 申請日: | 2020-01-14 |
| 公開(公告)號: | CN113128211A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 李偉偉;陳士亮;姜婷 | 申請(專利權)人: | 北京京東振世信息技術有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/242;G06Q30/06;G06Q10/08 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 郭晗;趙迪 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 物品 分類 方法 裝置 | ||
本發明公開了一種物品分類方法及裝置,涉及計算機技術領域。該方法的一具體實施方式包括:獲取待分類物品的第一物品名稱;根據分詞規則對所述第一物品名稱進行分詞,以獲得所述第一物品名稱對應的第一分詞;根據多個品類詞庫中與所述第一分詞相同的第二分詞的第一權重值,計算所述第一物品名稱分別對應于多個品類的第一分類參數;所述多個品類詞庫分別對應于不同的品類,每一個所述品類詞庫包括:多個第二分詞,所述第二分詞是根據所述分詞規則對屬于所述品類詞庫所對應的品類的第二物品名稱進行分詞而得到的;將所述待分類物品分類至最大的第一分類參數所對應的品類。該實施方式提高了物品分類的準確性和效率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種物品分類方法及裝置。
背景技術
在電商平臺或倉儲物流等場景下,一般根據物品所屬的品類對物品進行管理,因此,對物品進行準確的分類,對物品的高效管理具有重要意義。
現有技術對物品進行分類時,一般是根據管理人員的經驗,對物品進行分類。而電商平臺或倉儲物流等場景中,物品數量和種類均較多,管理人員難以準確的對大量物品進行準確分類,從而容易導致物品的錯誤分類,進而降低物品的管理效率。
發明內容
有鑒于此,本發明實施例提供一種物品分類方法及裝置,能夠根據待分類物品的第一名稱分別對應于不同品類的分類參數對待分類物品進行分類,提高了物品分類的準確性,進而提高了物品的管理效率。
為實現上述目的,根據本發明實施例的一個方面,提供了一種物品分類的方法。
本發明實施例的一種物品分類的方法包括:
獲取待分類物品的第一物品名稱;
根據分詞規則對所述第一物品名稱進行分詞,以獲得所述第一物品名稱對應的第一分詞;
根據多個品類詞庫中與所述第一分詞相同的第二分詞的第一權重值,計算所述第一物品名稱分別對應于多個品類的第一分類參數;所述多個品類詞庫分別對應于不同的品類,每一個所述品類詞庫包括:多個第二分詞,所述第二分詞是根據所述分詞規則對屬于所述品類詞庫所對應的品類的第二物品名稱進行分詞而得到的;
將所述待分類物品分類至最大的第一分類參數所對應的品類。
可選地,所述第一權重值為所述第二分詞對應于所述多個品類詞庫中的詞頻-逆向文件頻率。
可選地,
所述品類詞庫還包括:屬于所述品類詞庫所對應的品類的第二物品名稱、以及所述第二物品名稱對應于所述品類詞庫的第二分類參數;所述第二分類參數是根據所述第二物品名稱分詞得到的第二分詞對應于所述品類詞庫的第二權重值所得到的;
刪除所述品類詞庫中所述第二分類參數小于閾值的第二物品名稱,并遞減所述第二分類參數小于閾值的第二物品名稱對應的第二分詞在所述品類詞庫出現的次數,以對所述品類詞庫進行更新。
可選地,
根據更新后的品類詞庫,確定所述品類詞庫中所述第二分詞對應的第一權重值。
可選地,
根據無用詞詞典和專名識別詞典,對所述第一物品名稱和/或第二物品名稱進行分詞。
為實現上述目的,根據本發明實施例的又一方面,提供了一種物品分類的裝置。
本發明實施例的一種物品分類的裝置包括:分詞模塊、計算模塊和分類模塊;其中,
所述分詞模塊,用于獲取待分類物品的第一物品名稱,根據分詞規則對所述第一物品名稱進行分詞,以獲得所述第一物品名稱對應的第一分詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東振世信息技術有限公司,未經北京京東振世信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010037908.5/2.html,轉載請聲明來源鉆瓜專利網。





