[發明專利]分類模型的訓練方法、分類方法、裝置、計算機存儲介質有效
| 申請號: | 201811244834.1 | 申請日: | 2018-10-24 |
| 公開(公告)號: | CN111090753B | 公開(公告)日: | 2020-11-20 |
| 發明(設計)人: | 靳丁南;權圣 | 申請(專利權)人: | 馬上消費金融股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06N3/04 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何倚雯 |
| 地址: | 401120 重慶市渝北區*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類 模型 訓練 方法 裝置 計算機 存儲 介質 | ||
本申請公開了一種分類模型的訓練方法、訓練裝置、訓練終端以及計算機存儲介質,訓練方法包括:從網絡或歷史記錄隨機獲取到設定數量的第一無標注語料;對第一無標注語料進行處理,得到第一無標注語料的詞向量;通過語料的詞向量對預設LSTM語言模型進行訓練,建立第一模型;通過分類模型的第一標注語料對第二模型進行訓練,得到分類模型;其中,第二模型是通過在第一模型添加分類輸出模型結構而得到的。通過上述方式,能夠在不需要大量人工標注的前提下得到準確率較高的分類模型。
技術領域
本申請涉及模型應用技術領域,特別是涉及一種分類模型的訓練方法、分類方法、裝置、計算機存儲介質。
背景技術
現實生活中為,為了解決一些實際問題,通常會根據需要建立模型,如分類模型,這些模型在初始建立的時候,會通過很多測試數據對其進行訓練,得到各項指標參數,在測試合格后投入到市場應用。
在智能客服系統中,分類模型是非常有效且普遍的技術,常見任務例如意圖識別、情感識別、實體識別等大多使用的都是分類模型。分類模型屬于監督學習中的一種,而目前的監督學習一般需要大量的人工語料,其性能才能達到可商用的程度。
但對于大多數智能系統而言,收集和標注人工語料是一件人工成本很高的事情,而且效率也低。
發明內容
本申請主要解決的技術問題是提供一種分類模型的訓練方法、分類方法、裝置、計算機存儲介質,能夠在不需要大量人工標注的前提下得到準確率較高的分類模型。
為解決上述技術問題,本申請采用的第一個技術方案是:提供一種分類模型的訓練方法,包括:從網絡或者歷史記錄隨機獲取到設定數量的第一無標注語料;
對第一無標注語料進行處理,得到無標注語料的詞向量;
通過第一無標注語料的詞向量對預設LSTM語言模型進行訓練,建立第一模型;
通過分類模型的標注語料對第二模型進行訓練,得到分類模型;其中,第二模型是通過在第一模型添加分類輸出模型結構而得到的。
為解決上述技術問題,本申請采用的第二個技術方案是:提供一種基于分類模型的分類方法,分類模型是在經訓練好的第一模型上添加分類輸出模型結構后進行再訓練得到的,分類方法包括:
接收待分類的語料;
將所述語料輸入到所述分類模型中,通過所述分類模型將所述語料進行處理,得到所述語料的特征向量,并基于所述特征向量從全連接神經網絡中對預測結果進行查詢;
輸出所述預測結果。
為解決上述技術問題,本申請采用的第三個技術方案是:提供一種分類模型的訓練裝置,訓練裝置包括語料獲取模塊、預處理模塊、第一模型建立模塊以及第二模型訓練模塊,
語料獲取模塊用于從網絡或者歷史記錄隨機獲取到設定數量的第一無標注語料;
預處理模塊用于對第一無標注語料進行處理,得到第一無標注語料的詞向量;
第一模型建立模塊用于通過語料的詞向量對預設LSTM語言模型進行訓練,建立第一模型;
第二模型訓練模塊用于通過分類模型的標注語料對第二模型進行訓練,得到分類模型;其中,第二模型包括第一模型以及添加在第一模型上的分類輸出模型結構。
為解決上述技術問題,本申請采用的第四個技術方案是:提供一種智能客服系統,所述智能客服系統包括分類模型,分類模型是在經訓練好的第一模型上添加分類輸出模型結構后進行再訓練得到的,包括接收模塊、分類模塊以及輸出模塊,
所述接收模塊用于接收待分類的語料;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于馬上消費金融股份有限公司,未經馬上消費金融股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811244834.1/2.html,轉載請聲明來源鉆瓜專利網。





