[發(fā)明專利]文本機器人交叉驗證優(yōu)化方法及裝置在審
| 申請?zhí)枺?/td> | 202010903444.1 | 申請日: | 2020-09-01 |
| 公開(公告)號: | CN112035666A | 公開(公告)日: | 2020-12-04 |
| 發(fā)明(設(shè)計)人: | 梁雨霏 | 申請(專利權(quán))人: | 中國銀行股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N20/00;G06F16/332 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 谷敬麗;吳學(xué)鋒 |
| 地址: | 100818 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 機器人 交叉 驗證 優(yōu)化 方法 裝置 | ||
1.一種文本機器人交叉驗證優(yōu)化方法,其特征在于,包括:
利用已標(biāo)記預(yù)設(shè)正確答復(fù)語句的詢問語句測試多個語料模型,每個應(yīng)答語料模型輸出對應(yīng)的答復(fù)語句,所述多個語料模型是利用多組語料訓(xùn)練集訓(xùn)練機器學(xué)習(xí)模型得到,每組語料訓(xùn)練集包括多個問答語句對,每個問答語句對包括一詢問語句和對應(yīng)的一答復(fù)語句;所述問答語句對是文本機器人與客戶進(jìn)行信息交互產(chǎn)生的;
比對所述預(yù)設(shè)正確答復(fù)語句與每個應(yīng)答語料模型輸出的答復(fù)語句,生成答復(fù)正誤對照表;
根據(jù)所述答復(fù)正誤對照表中錯誤答復(fù)語句的數(shù)量優(yōu)化所述機器學(xué)習(xí)模型的算法或者優(yōu)化包括所述問答語句對的語料庫。
2.根據(jù)權(quán)利要求1所述的文本機器人交叉驗證優(yōu)化方法,其特征在于,還包括:采集文本機器人與客戶進(jìn)行信息交互產(chǎn)生的問答語句對,生成所述語料庫。
3.根據(jù)權(quán)利要求1所述的文本機器人交叉驗證優(yōu)化方法,其特征在于,還包括:建立所述機器學(xué)習(xí)模型。
4.根據(jù)權(quán)利要求2所述的文本機器人交叉驗證優(yōu)化方法,其特征在于,還包括:
對所述語料庫進(jìn)行多次隨機抽取,得到多組語料訓(xùn)練集。
5.根據(jù)權(quán)利要求1所述的文本機器人交叉驗證優(yōu)化方法,其特征在于,所述根據(jù)所述答復(fù)正誤對照表中錯誤答復(fù)語句的數(shù)量優(yōu)化所述機器學(xué)習(xí)模型的算法或者優(yōu)化包括所述問答語句對的語料庫,包括:
針對同一詢問語句,若所述答復(fù)正誤對照表中對應(yīng)答復(fù)語句錯誤率高于設(shè)定閾值,將該詢問語句加入誤判集合;
根據(jù)錯誤答復(fù)語句的數(shù)量和同一詢問語句對應(yīng)的所有答復(fù)語句的數(shù)量,結(jié)合所述答復(fù)語句錯誤率對該詢問語句進(jìn)行分類;
根據(jù)每個詢問語句所處的分類,優(yōu)化所述機器學(xué)習(xí)模型的算法或者優(yōu)化包括所述問答語句對的語料庫。
6.根據(jù)權(quán)利要求5所述的文本機器人交叉驗證優(yōu)化方法,其特征在于,所述根據(jù)錯誤答復(fù)語句的數(shù)量和同一詢問語句對應(yīng)的所有答復(fù)語句的數(shù)量,結(jié)合所述答復(fù)語句錯誤率對該詢問語句進(jìn)行分類,包括:
若所述錯誤答復(fù)語句的數(shù)量低于第一設(shè)定閾值,并且所有答復(fù)語句的數(shù)量低于第二設(shè)定閾值,將該詢問語句分類至第一類別;
若所述錯誤答復(fù)語句的數(shù)量低于第一設(shè)定閾值,并且所有答復(fù)語句的數(shù)量高于第二設(shè)定閾值,將該詢問語句分類至第二類別;
若所述錯誤答復(fù)語句的數(shù)量高于第一設(shè)定閾值,并且所有答復(fù)語句的數(shù)量高于第二設(shè)定閾值,將該詢問語句分類至第三類別。
7.根據(jù)權(quán)利要求6所述的文本機器人交叉驗證優(yōu)化方法,其特征在于,所述優(yōu)化包括修正操作和改進(jìn)操作,優(yōu)化所述語料庫或者所述機器學(xué)習(xí)模型的算法,包括:
若所述詢問語句為第一類別,補充所述詢問語句對應(yīng)的問答對至所述詢問語句對應(yīng)的語料訓(xùn)練集;
若所述詢問語句為第二類別,修正所述語料庫;
若所述詢問語句為第三類別,修正所述機器學(xué)習(xí)模型的算法。
8.根據(jù)權(quán)利要求1所述的文本機器人交叉驗證優(yōu)化方法,其特征在于,還包括:利用多組語料訓(xùn)練集訓(xùn)練機器學(xué)習(xí)模型,得到對應(yīng)數(shù)量的應(yīng)答語料模型。
9.一種文本機器人交叉驗證優(yōu)化裝置,其特征在于,包括:
測試模塊,利用已標(biāo)記預(yù)設(shè)正確答復(fù)語句的詢問語句測試多個語料模型,每個應(yīng)答語料模型輸出對應(yīng)的答復(fù)語句,所述多個語料模型是利用多組語料訓(xùn)練集訓(xùn)練機器學(xué)習(xí)模型得到,每組語料訓(xùn)練集包括多個問答語句對,每個問答語句對包括一詢問語句和對應(yīng)的一答復(fù)語句;所述問答語句對是文本機器人與客戶進(jìn)行信息交互產(chǎn)生的;
比對模塊,比對所述預(yù)設(shè)正確答復(fù)語句與每個應(yīng)答語料模型輸出的答復(fù)語句,生成答復(fù)正誤對照表;
優(yōu)化模塊,根據(jù)所述答復(fù)正誤對照表中錯誤答復(fù)語句的數(shù)量優(yōu)化所述機器學(xué)習(xí)模型的算法或者優(yōu)化包括所述問答語句對的語料庫。
10.根據(jù)權(quán)利要求9所述的文本機器人交叉驗證優(yōu)化裝置,其特征在于,還包括:語料庫生成模塊,采集文本機器人與客戶進(jìn)行信息交互產(chǎn)生的問答語句對,生成所述語料庫。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國銀行股份有限公司,未經(jīng)中國銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010903444.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





