[發明專利]多分類方法及裝置、電子設備和存儲介質在審
| 申請號: | 201910134159.5 | 申請日: | 2019-02-22 |
| 公開(公告)號: | CN110008990A | 公開(公告)日: | 2019-07-12 |
| 發明(設計)人: | 郁延書 | 申請(專利權)人: | 上海拉扎斯信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q30/06;G06Q50/12 |
| 代理公司: | 上海晨皓知識產權代理事務所(普通合伙) 31260 | 代理人: | 成麗杰 |
| 地址: | 200333 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類模型 訓練集 存儲介質 電子設備 訓練樣本 機器學習技術 整體訓練 重復執行 分類 | ||
本發明實施例涉及機器學習技術領域,公開了一種多分類方法及裝置、電子設備和存儲介質。該方法包括:生成初始訓練集,基于初始訓練集訓練得到第一分類模型;將第一分類模型對應的訓練樣本從訓練集中分離得到第二分類模型的訓練集;基于第二分類模型的訓練集訓練得到第二分類模型;重復執行上述分離訓練樣本并訓練獲得分類模型,以獲得多個分類模型。本發明實施方式使得訓練速度可隨已完成訓練類別的增多而提高,從而提高整體訓練效率。
技術領域
本發明涉及機器學習技術領域,特別涉及一種多分類方法及裝置、電子設備和存儲介質。
背景技術
近年來外賣平臺等互聯網業務發展迅速,為人們的生活帶來了極大的便利。目前,平臺業務量已經十分龐大且隨著業務的快速增長,機器學習技術成為不斷優化平臺服務質量的關鍵。現今平臺一般采用多分類技術對平臺中商戶的主要經營范圍進行分類,以便為用戶提供更匹配的服務商戶。商戶經營范圍是根據外賣平臺商戶提供的商品和服務概括得到的商戶的經營范圍,如“家常小炒”、“蓋飯”、“麻辣燙”等。一些商戶可能有家常小炒、蓋飯、盒飯便當、粥等多個類別的經營范圍。商戶的主要經營范圍是給每個商戶從多個類別的經營范圍中標注其中一個類別的經營范圍作為最主要的經營范圍。
發明人發現相關技術至少存在以下問題:現有平臺商戶的主要經營范圍的多分類方法中需要訓練得到多個類別的分類模型,在訓練得到每個類別的分類模型時,均是把訓練集中該類別的樣本歸為正樣本,其余樣本作為負樣本訓練得到一分類模型,這樣k個類別的多分類方法就需要構造k個分類模型。而由于每個類別的分類模型的訓練都是將訓練集中全部的樣本作為訓練樣本,隨著訓練樣本的數量不斷增加訓練速度會急劇減慢。
發明內容
本發明實施方式的目的在于提供一種多分類方法及裝置、電子設備和存儲介質,使得訓練速度可隨已完成訓練類別的增多而提高,從而提高整體訓練效率。
為解決上述技術問題,本發明的實施方式提供了一種多分類方法,包括:
生成初始訓練集,基于所述初始訓練集訓練得到第一分類模型;
將所述第一分類模型對應的訓練樣本從訓練集中分離得到第二分類模型的訓練集;
基于所述第二分類模型的訓練集訓練得到第二分類模型;
重復執行上述分離訓練樣本并訓練獲得分類模型,以獲得多個分類模型。
本發明的實施方式還提供了一種多分類裝置,包括:
生成模塊,用于生成初始訓練集;
第一訓練模塊,用于基于所述初始訓練集訓練得到第一分類模型;
第二訓練模塊,用于將所述第一分類模型對應的訓練樣本從訓練集中分離得到第二分類模型的訓練集,并基于所述第二分類模型的訓練集訓練得到第二分類模型;
控制模塊,用于重復調用所述第二訓練模塊執行分離訓練樣本并訓練獲得分類模型,以獲得多個分類模型。
本發明的實施方式還提供了一種電子設備,包括:存儲器和處理器,存儲器存儲計算機程序,處理器運行所述計算機程序以實現:
生成初始訓練集,基于所述初始訓練集訓練得到第一分類模型;
將所述第一分類模型對應的訓練樣本從訓練集中分離得到第二分類模型的訓練集;
基于所述第二分類模型的訓練集訓練得到第二分類模型;
重復執行上述分離訓練樣本并訓練獲得分類模型,以獲得多個分類模型。
本發明的實施方式還提供了一種存儲介質,用于存儲計算機可讀程序,所述計算機可讀程序用于供計算機執行如前所述的多分類方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海拉扎斯信息科技有限公司,未經上海拉扎斯信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910134159.5/2.html,轉載請聲明來源鉆瓜專利網。





