[發明專利]類別識別方法、裝置、電子設備及計算機可讀存儲介質有效
| 申請號: | 201711271261.7 | 申請日: | 2017-12-05 |
| 公開(公告)號: | CN107958270B | 公開(公告)日: | 2020-07-31 |
| 發明(設計)人: | 郁延書;龔建 | 申請(專利權)人: | 北京小度信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q30/02 |
| 代理公司: | 北京智信四方知識產權代理有限公司 11519 | 代理人: | 劉真 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 類別 識別 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
本公開實施例公開了一種類別識別方法、裝置、電子設備及計算機可讀存儲介質,所述方法包括:獲取系統對象類別訓練數據集,所述系統對象類別訓練數據集中的系統對象數據具有評價類別;對所述系統對象類別訓練數據集進行訓練,得到系統對象類別識別模型;根據所述系統對象類別識別模型對測試對象進行類別識別。本公開實施例提供的技術方案,脫離了對于人工標注的依賴,能夠對于系統對象進行自動類別識別,且能夠取得較高的類別識別準確率,該方案省時省力,維護成本低,準確率高,能夠實現為用戶提供精準服務的目標,進而增強用戶體驗。
技術領域
本公開涉及信息處理技術領域,具體涉及一種類別識別方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
隨著互聯網技術的發展,越來越多的商戶或者服務提供商通過互聯網渠道來推廣產品和服務,并力求在推廣產品和服務的基礎上爭取更多的用戶訂單,以提升現有資源的利用率,為商戶或者服務提供商創造更多的價值。為了能夠為用戶提供更為精準的服務,互聯網平臺對于其能夠提供的服務均進行了分類,但目前,這些分類基本都是依靠人工標注完成,在數據量巨大且呈迅速增長趨勢的情況下,這樣人工分類的方式不僅耗時耗力、維護成本高,而且還存在準確率低下的缺陷,這樣就不能夠實現為用戶提供精準服務的目標,進而還會削弱用戶體驗。
發明內容
本公開實施例提供一種類別識別方法、裝置、電子設備及計算機可讀存儲介質。
第一方面,本公開實施例中提供了一種類別識別方法。
具體的,所述類別識別方法,包括:
獲取系統對象類別訓練數據集,所述系統對象類別訓練數據集中的系統對象數據具有評價類別;
對所述系統對象類別訓練數據集進行訓練,得到系統對象類別識別模型;
根據所述系統對象類別識別模型對測試對象進行類別識別。
結合第一方面,本公開在第一方面的第一種實現方式中,所述獲取系統對象類別訓練數據集,包括:
獲取第一預設歷史時間段內已分類系統對象數據,其中,所述系統對象數據包括:對象名稱、對象類別、源屬性、產品名稱、產品產出量中的一種或多種;
對具有同一源屬性的系統對象的類別進行評價,將評價分值高于預設評價閾值的類別作為該源屬性所有系統對象的評價類別;
將具有評價類別的系統對象數據作為系統對象類別訓練數據,生成所述系統對象類別訓練數據集。
結合第一方面,本公開在第一方面的第一種實現方式中,所述對具有同一源屬性的系統對象的類別進行評價,將評價分值高于預設評價閾值的類別作為該源屬性所有系統對象的評價類別,包括:
統計具有同一源屬性且具有同一類別的系統對象的數量;
按照數量的大小確定相應類別的評價分值;
將評價分值高于預設評價閾值的類別確定為該源屬性所有系統對象的評價類別。
結合第一方面,本公開在第一方面的第一種實現方式中,所述對系統對象類別訓練數據集進行訓練,得到系統對象類別識別模型,包括:
提取系統對象類別訓練數據的訓練特征;
根據訓練數據的類型和識別結果目標類型確定分類函數;
基于訓練數據訓練確定所述分類函數的參數,得到所述系統對象類別識別模型。
結合第一方面,本公開在第一方面的第一種實現方式中,所述提取系統對象類別訓練數據的訓練特征,包括:
基于系統對象類別訓練數據確定系統對象產出詞典,其中,所述系統對象產出詞典包括每一系統對象每一產品的產出數量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小度信息科技有限公司,未經北京小度信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711271261.7/2.html,轉載請聲明來源鉆瓜專利網。





