[發(fā)明專利]意圖識別模型更新方法及相關(guān)設(shè)備在審
| 申請?zhí)枺?/td> | 202111095912.8 | 申請日: | 2021-09-18 |
| 公開(公告)號: | CN113792540A | 公開(公告)日: | 2021-12-14 |
| 發(fā)明(設(shè)計)人: | 羅圣西;馬駿;王少軍 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F16/33;G06F16/332;G06K9/62 |
| 代理公司: | 北京市京大律師事務(wù)所 11321 | 代理人: | 姚維 |
| 地址: | 518033 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 意圖 識別 模型 更新 方法 相關(guān) 設(shè)備 | ||
本發(fā)明涉及人工智能領(lǐng)域,公開了一種意圖識別模型更新方法及相關(guān)設(shè)備。該方法包括:獲取原始對話語料,利用意圖模型識別得到第一意圖類別;將語料初始化為掩碼列表,根據(jù)選取規(guī)則替換掩碼列表中的元素值;進而構(gòu)建原始對話語料對應(yīng)的附屬對話語料,并通過訓(xùn)練模型識別得到第二意圖類別;對第一、二意圖類別進行差異程度檢測,得到第一檢測結(jié)果,選取得到作為備選集外語料;通過訓(xùn)練模型識別備選集外語料得到第三意圖類別;對第一、三意圖類別進行差異程度檢測,得到第二檢測結(jié)果,選取得到最終集外語料;進而將其和原始對話語料進行重新訓(xùn)練得到意圖識別模型。本發(fā)明提高了意圖識別模型對語料意圖的識別精準(zhǔn)度。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能領(lǐng)域,尤其涉及一種意圖識別模型更新方法及相關(guān)設(shè)備。
背景技術(shù)
隨著計算機技術(shù)的不斷發(fā)展和創(chuàng)新的背景下,人工智能技術(shù)已經(jīng)逐漸應(yīng)用于各行各業(yè)之中,相關(guān)智能產(chǎn)品和技術(shù)應(yīng)用也逐漸滲透于人們?nèi)粘I畹姆椒矫婷嬷校瑯O大地改善人們的生產(chǎn)生活,其中人機對話是人工智能的一個重要研究領(lǐng)域,它是研究如何使計算機能夠理解和運用人類社會的自然語言,實現(xiàn)人機之間的自然語言通信,起到計算機能代替人的部分腦力勞動,以及延伸人類大腦、減少人類部分工作的作用,在日常生活中,對話場景的復(fù)雜多樣,要求計算機能夠在對話的過程中準(zhǔn)確地識別客戶的意圖,更好地理解客戶的需要以便于更好地展開對話,滿足客戶真正的需求。
“意圖識別”指的是對用戶輸入的一段用于表達查詢需求的信息,判斷用戶所述的意圖類別,目前的意圖識別技術(shù)主要應(yīng)用于搜索引擎、人機對話系統(tǒng)等,在應(yīng)用于人機對話之時,通過構(gòu)建一個意圖識別模型用來識別客戶的意圖,由于在日常人機對話中,會受到環(huán)境噪音的干擾,會產(chǎn)生大量不屬于已有意圖類別的中的語料如果意圖識別模型不能正確辨識出這種語料,則會對用戶體驗產(chǎn)生較大影響,嚴(yán)重時可能會有泄露用戶隱私的風(fēng)險。現(xiàn)有解決方法是通過數(shù)據(jù)增強方法生成集外語料,一般是隨機插入、刪除、交換等操作,通過集外語料訓(xùn)練意圖識別模型的拒識能力,但是這種數(shù)據(jù)增強方法無法保證生成的語料一定屬于集外類別,還會導(dǎo)致訓(xùn)練語料中出現(xiàn)語料糾纏的現(xiàn)象,影響所訓(xùn)練出來的意圖識別模型對正常語料的識別效果,即現(xiàn)有意圖識別模型的意圖識別精準(zhǔn)度較低的問題。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于解決現(xiàn)有意圖識別模型的意圖識別精準(zhǔn)度較低的問題的技術(shù)問題。
本發(fā)明第一方面提供了一種意圖識別模型更新方法,其特征在于,所述意圖識別模型更新包括:獲取原始對話語料,并通過預(yù)置意圖識別模型,識別所述原始對話語料中每個語句的第一意圖類別;初始化所述原始對話語料對應(yīng)的掩碼列表,并根據(jù)預(yù)置選取規(guī)則調(diào)整所述掩碼列表中的一組元素值,得到調(diào)整后的掩碼列表;基于所述調(diào)整后的掩碼列表,構(gòu)建所述原始對話語料對應(yīng)的附屬對話語料,并通過所述意圖識別模型,識別所述附屬對話語料中每個語句的第二意圖類別;對所述第一意圖類別和所述第二意圖類別進行差異程度檢測,得到第一檢測結(jié)果,并基于所述第一檢測結(jié)果,從所述附屬對話語料中選取滿足預(yù)置差異條件的語句作為最終集外語料;將所述最終集外語料標(biāo)注為集外意圖,并采用所述原始對話語料和所述最終集外語料,對所述意圖識別模型進行訓(xùn)練,得到新的意圖識別模型。
可選的,在本發(fā)明第一方面的第一種實現(xiàn)方式中,所述初始化所述原始對話語料對應(yīng)的掩碼列表包括:對所述原始對話語料進行分句處理,得到多個語句,并分別計算所述原始對話語料每個語句的字符串長度;采用與各所述字符串長度相同的預(yù)置第一元素值,分別組合成每個語句對應(yīng)的掩碼;采用所述掩碼構(gòu)建所述原始對話語料對應(yīng)的掩碼列表。
可選的,在本發(fā)明第一方面的第二種實現(xiàn)方式中,所述根據(jù)預(yù)置選取規(guī)則調(diào)整所述掩碼列表中的一組元素值,得到調(diào)整后的掩碼列表包括:根據(jù)預(yù)置選取規(guī)則,分別確定所述掩碼列表中每段掩碼對應(yīng)的調(diào)整位置;采用預(yù)置第二元素值替換所述調(diào)整位置上的第一元素值,得到調(diào)整后的掩碼列表。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111095912.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于意圖挖掘的方法和設(shè)備
- 意圖估計裝置以及意圖估計方法
- 意圖識別方法、裝置、設(shè)備及計算機可讀介質(zhì)
- 意圖確認(rèn)方法及裝置
- 搜索意圖識別方法、裝置、電子設(shè)備和存儲介質(zhì)
- 語句多意圖識別方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 對話系統(tǒng)中意圖沖突的解決方法、系統(tǒng)及裝置
- 信息通信網(wǎng)絡(luò)的意圖轉(zhuǎn)譯方法、系統(tǒng)、介質(zhì)及交互接口
- 語音對話的意圖識別方法、系統(tǒng)、設(shè)備及存儲介質(zhì)
- 意圖識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)





