[發(fā)明專利]相似問題的生成方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110567582.1 | 申請日: | 2021-05-24 |
| 公開(公告)號: | CN113268564B | 公開(公告)日: | 2023-07-21 |
| 發(fā)明(設(shè)計)人: | 蒙元 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F40/126;G06F18/214 |
| 代理公司: | 深圳市明日今典知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44343 | 代理人: | 王杰輝;曹勇 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 相似 問題 生成 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本申請涉及人工智能技術(shù)領(lǐng)域,揭示了一種相似問題的生成方法、裝置、設(shè)備及存儲介質(zhì),其中方法包括:將目標標準問題文本輸入目標相似問題生成模型進行相似問題生成得到待分析的相似問題集合;根據(jù)目標標準問題文本進行未訓練過字符查找得到未訓練過字符集合;采用滑窗掃描方法根據(jù)未訓練過字符集合和目標標準問題文本,對待分析的相似問題集合進行未訓練過字符填寫得到待優(yōu)化的相似問題集合;根據(jù)目標標準問題文本對待優(yōu)化的相似問題集合進行優(yōu)化處理得到目標相似問題集合。實現(xiàn)了自動化進行相似問題的生成,通過未訓練過字符的填寫使模型可以對帶有未訓練過字符的目標標準問題文本進行相似問題生成,優(yōu)化處理有利于提高確定的相似問題的準確性。
技術(shù)領(lǐng)域
本申請涉及到人工智能技術(shù)領(lǐng)域,特別是涉及到一種相似問題的生成方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
在現(xiàn)階段的問答機器人應(yīng)用中,智能客服是一個重要的版塊。智能客服在應(yīng)用過程中,不僅需要回答大量的常用的問題,還需要回答少量的不常見和/或定制化的問題,才能夠最大程度的覆蓋客戶的需求,增加智能客服的使用率和減少轉(zhuǎn)人工服務(wù)的比例。基于上述需求,問答機器人的智能客服需要有對大量的常用問題的回答能力,同時也需要對特定并有時效性的問題有回答并且實時跟進更新的能力。傳統(tǒng)智能客服使用的問答匹配系統(tǒng)大多數(shù)為基于全文檢索系統(tǒng)與深度語義匹配的端到端構(gòu)架,端到端構(gòu)架的好處是模型的構(gòu)造與訓練比較簡單直接,參數(shù)量大的模型在大量數(shù)據(jù)集中表現(xiàn)較好,缺點是采用分類模型每一次推理的時間消耗較大和黑盒模型的可解釋性不強。與此同時,不斷有新增知識更新迭代進知識庫,新的標準問題在剛?cè)胫R庫時所對應(yīng)的相似問題數(shù)量極少,導(dǎo)致覆蓋面窄,從而使基于此類數(shù)據(jù)集訓練得到的問答匹配系統(tǒng)在新增知識的覆蓋度上會有一定劣勢。為了擴充現(xiàn)有知識庫中新增知識的相似問題以使其在確保相似問題多樣性的同時達到要求相似問題的數(shù)量規(guī)模,采用人工擴寫相似問題的方法,從而增加了人工成本,而且因受人常規(guī)思維的限制,導(dǎo)致不容易將相似問題寫得全面,影響了模型的訓練效果。
發(fā)明內(nèi)容
本申請的主要目的為提供一種相似問題的生成方法、裝置、設(shè)備及存儲介質(zhì),旨在解決現(xiàn)有技術(shù)采用人工擴寫相似問題的方法,因受人常規(guī)思維的限制,導(dǎo)致不容易將相似問題寫得全面的技術(shù)問題。
為了實現(xiàn)上述發(fā)明目的,本申請?zhí)岢鲆环N相似問題的生成方法,所述方法包括:
獲取目標標準問題文本;
將所述目標標準問題文本輸入目標相似問題生成模型進行相似問題生成,得到待分析的相似問題集合;
根據(jù)所述目標標準問題文本進行未訓練過字符查找,得到未訓練過字符集合;
采用滑窗掃描方法,根據(jù)所述未訓練過字符集合和所述目標標準問題文本,對所述待分析的相似問題集合進行未訓練過字符填寫,得到待優(yōu)化的相似問題集合;
根據(jù)所述目標標準問題文本對所述待優(yōu)化的相似問題集合進行優(yōu)化處理,得到目標相似問題集合。
本申請還提出了一種相似問題的生成裝置,所述裝置包括:
文本獲取模塊,用于獲取目標標準問題文本;
待分析的相似問題集合確定模塊,用于將所述目標標準問題文本輸入目標相似問題生成模型進行相似問題生成,得到待分析的相似問題集合;
未訓練過字符集合確定模塊,用于根據(jù)所述目標標準問題文本進行未訓練過字符查找,得到未訓練過字符集合;
待優(yōu)化的相似問題集合確定模塊,用于采用滑窗掃描方法,根據(jù)所述未訓練過字符集合和所述目標標準問題文本,對所述待分析的相似問題集合進行未訓練過字符填寫,得到待優(yōu)化的相似問題集合;
目標相似問題集合確定模塊,用于根據(jù)所述目標標準問題文本對所述待優(yōu)化的相似問題集合進行優(yōu)化處理,得到目標相似問題集合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110567582.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





