[發明專利]一種基于集成學習的問答方法及系統在審
| 申請號: | 202011187451.2 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112287084A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 吳寧;嵇友浪;孫少辰;趙洪瑩;俞陽;鄒云峰 | 申請(專利權)人: | 國網江蘇省電力有限公司營銷服務中心 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/284;G06N20/20 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 王麗霞 |
| 地址: | 210019 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 集成 學習 問答 方法 系統 | ||
1.一種基于集成學習的問答方法,其特征在于,包括如下步驟:
將用戶問題輸入預先訓練好的集成學習模型,所述集成學習模型包含多個機器學習模型,每個機器學習模型輸出該用戶問題應由哪一個子問答模塊來回答的分類結果;
對所述多個機器學習模型的分類結果進行投票集成,根據投票集成結果確定最終調用的子問答模塊。
2.根據權利要求1所述的方法,其特征在于,還包括:在輸入集成學習模型之前,對用戶問題進行預處理。
3.根據權利要求2所述的方法,其特征在于,所述預處理,包括:
對用戶問題進行統一編碼;
對編碼后的用戶問題進行簡繁轉換;
對簡繁轉換后用戶問題進行停用詞移除。
4.根據權利要求1所述的方法,其特征在于,所述集成學習模型的訓練方法,包括:
獲取用戶問題訓練集;
對訓練集中的每個用戶問題標注該問題應由哪一個子問答模塊來回答;
將標注好的訓練集輸入所述集成學習模型中的每個機器學習模型,以對每個機器學習模型進行訓練。
5.根據權利要求4所述的方法,其特征在于,所述訓練方法,還包括:對訓練后的每個機器學習模型的預測性能進行評價。
6.根據權利要求5所述的方法,其特征在于,對每個機器學習模型的預測性能進行評價的方法,包括:
將包含用戶問題和對應標注結果的測試集輸入所述集成學習模型中的每個機器學習模型,每個機器學習模型輸出對應的預測結果;
根據所述預測結果和所述對應標注結果,計算F1指標;
根據F1指標評價所述集成學習模型的預測性能。
7.根據權利要求3所述的方法,其特征在于,所述訓練方法,還包括:使用用戶反饋的數據對所述集成學習模型中的每個機器學習模型進行訓練。
8.一種基于集成學習的問答系統,其特征在于,包括:
分類結果預測模塊,配置為將用戶問題輸入預先訓練好的集成學習模型,所述集成學習模型包含多個機器學習模型,每個機器學習模型輸出該用戶問題應由哪一個子問答模塊來回答的分類結果;
投票模塊,用于對所述多個機器學習模型的分類結果進行投票集成,根據投票集成結果確定最終調用的子問答模塊。
9.根據權利要求8所述的系統,其特征在于,還包括:數據預處理模塊,配置為在將用戶問題輸入集成學習模型之前,對用戶問題進行預處理。
10.根據權利要求8所述的系統,其特征在于,還包括:問答日志數據庫,配置為存儲用戶問題和對應的子問答模塊調用結果,以及用戶反饋的用戶問題應由哪個子問答模塊回答的數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網江蘇省電力有限公司營銷服務中心,未經國網江蘇省電力有限公司營銷服務中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011187451.2/1.html,轉載請聲明來源鉆瓜專利網。





