[發明專利]自動應答處理方法、裝置、電子設備及可讀存儲介質在審
| 申請號: | 202010797069.7 | 申請日: | 2020-08-10 |
| 公開(公告)號: | CN112269860A | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 王陽陽 | 申請(專利權)人: | 北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F16/33;G06Q30/00 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 宋興;臧建明 |
| 地址: | 100076 北京市經濟技術開*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動 應答 處理 方法 裝置 電子設備 可讀 存儲 介質 | ||
1.一種自動應答處理方法,其特征在于,包括:
獲取用戶輸入的詢問信息的文本;
將所述詢問信息的文本輸入目標文本分類模型,得到所述詢問信息的文本分類信息,所述目標文本分類模型使用多個目標訓練文本對中間文本分類模型進行訓練得到,所述目標訓練文本包括多個語料信息和每個所述語料信息的目標分類信息,所述目標分類信息為預先基于初始文本分類模型對所述語料信息進行處理得到的,所述中間文本分類模型由所述初始文本分類模型在對所述語料信息處理時更新所述初始文本分類模型得到;
根據所述詢問信息的文本分類信息,確定所述詢問信息的應答信息;
輸出所述詢問信息的應答信息。
2.根據權利要求1所述的方法,其特征在于,所述將所述詢問信息的文本輸入目標文本分類模型之前,還包括:
根據所述語料信息的初始分類信息以及由所述初始文本分類模型輸出的所述語料信息的參考分類信息,確定所述語料信息的目標分類信息,并更新所述初始文本分類模型,得到所述中間文本分類模型;
使用所述語料信息和所述語料信息的目標分類信息,對所述中間文本分類模型進行訓練,得到所述目標文本分類模型。
3.根據權利要求2所述的方法,其特征在于,所述根據所述語料信息的初始分類信息以及由所述初始文本分類模型輸出的所述語料信息的參考分類信息,確定所述語料信息的目標分類信息,并更新所述初始文本分類模型,包括:
將所述多個語料信息劃分為預設數量的語料集合,所述預設數量大于等于2,將所述預設數量的語料集合中的第一語料集合作為待分類集合;
將所述待分類集合聚類為至少一個子集合,得到所述待分類集合中各語料信息的初始分類信息,其中,同一子集合中各語料信息的初始分類信息相同;
A、根據所述待分類集合中各語料信息的初始分類信息、由所述初始文本分類模型輸出的所述待分類集合中各語料信息的參考分類信息,更新所述初始文本分類模型,以及確定是否需要修正所述語料信息的初始分類信息;若是,則執行步驟B,若否,則執行步驟C;
B、根據所述初始分類信息以及所述參考分類信息對所述語料信息的初始分類信息進行修正,得到所述待分類集合各語料信息的新的初始分類信息,并執行步驟A;
C、若所述待分類集合不包括全部所述多個語料信息,則將所述預設數量的語料集合中的第二語料集合加入所述待分類集合中,得到新的待分類集合,所述第二語料集合中各語料信息的初始分類信息基于所述初始文本分類模型對所述第二語料集合的處理得到,并執行步驟A;若所述待分類集合包括全部所述多個語料信息,則將所述待分類集合中各語料信息的初始分類信息作為所述各語料信息的目標分類信息,并結束。
4.根據權利要求3所述的方法,其特征在于,所述根據所述初始分類信息以及所述參考分類信息對所述語料信息的初始分類信息進行修正,得到所述待分類集合各語料信息的新的初始分類信息,包括:
將滿足第一條件的語料信息的初始分類信息的分類值修改為無分類,所述第一條件包括:所述語料信息的參考分類信息的概率值小于第一閾值,且所述語料信息的初始分類信息與參考分類信息不同,且所述語料信息的初始分類信息的分類值非無分類;
若所述待分類集合中初始分類信息的分類值為無分類的語料信息的數量大于第二閾值,則將分類值為無分類的語料信息聚類為至少一個集合,同一集合中的語料信息的分類值相同,根據聚類結果對待分類集合中分類值為無分類的語料信息的初始分類信息進行修正;
根據修正后的所述待分類集合中各語料信息的初始分類信息之間的混淆參數,合并修正后的所述待分類集合中各語料信息的初始分類信息,得到所述待分類集合各語料信息的新的初始分類信息。
5.根據權利要求4所述的方法,其特征在于,所述根據聚類結果對待分類集合中分類值為無分類的語料信息的初始分類信息進行修正,包括:
若所述聚類結果中存在語料信息的數量大于第三閾值的簇,則將所述簇中的語料信息的初始分類信息的分類值修改為相同的值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司,未經北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010797069.7/1.html,轉載請聲明來源鉆瓜專利網。





