[發(fā)明專利]意圖識別模型訓(xùn)練方法、意圖識別方法、裝置及設(shè)備在審

申請?zhí)枺?/td>	202011135184.4	申請日：	2020-10-21
公開（公告）號：	CN112257458A	公開（公告）日：	2021-01-22
發(fā)明（設(shè)計）人：	蔡巖松;杜新凱;牛國揚;王彥昕;劉謙;高峰	申請（專利權(quán)）人：	陽光保險集團股份有限公司
主分類號：	G06F40/35	分類號：	G06F40/35;G06N3/00
代理公司：	北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 11463	代理人：	曹瑞敏
地址：	518000 廣東省深圳市福田***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	意圖識別模型訓(xùn)練方法裝置設(shè)備
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本申請?zhí)峁┮环N意圖識別模型訓(xùn)練方法、意圖識別方法、裝置及設(shè)備，涉及自然語言處理技術(shù)領(lǐng)域。該方法包括：根據(jù)意圖識別模型所應(yīng)用的第一領(lǐng)域，獲取第一訓(xùn)練語料，該第一訓(xùn)練語料包括該第一領(lǐng)域的標注的語料；使用該第一訓(xùn)練語料，訓(xùn)練得到第一訓(xùn)練模型；根據(jù)該意圖識別模型所應(yīng)用的第二領(lǐng)域，獲取第二訓(xùn)練語料，該第二領(lǐng)域為該第一領(lǐng)域內(nèi)的子領(lǐng)域，該第二訓(xùn)練語料包括該第二領(lǐng)域的標注的語料；使用該第二訓(xùn)練語料訓(xùn)練該第一訓(xùn)練模型，得到第二訓(xùn)練模型；獲取第三訓(xùn)練語料，該第三訓(xùn)練語料為該第二領(lǐng)域內(nèi)標注有意圖信息的語料；使用該第三訓(xùn)練語料訓(xùn)練該第二訓(xùn)練模型，得到該意圖識別模型。應(yīng)用本申請實施例，可以提高意圖識別的準確率。

技術(shù)領(lǐng)域

本申請涉及自然語言處理技術(shù)領(lǐng)域，具體而言，涉及一種意圖識別模型訓(xùn)練方法、意圖識別方法、裝置及設(shè)備。

背景技術(shù)

隨著網(wǎng)絡(luò)技術(shù)的發(fā)展，人工智能中的自然語言處理技術(shù)在對話機器人中得到了廣泛的應(yīng)用，無論是封閉性的對話方式還是開放性的對話方式，意圖識別的準確與否都直接關(guān)系到對話機器人的質(zhì)量。

由于技術(shù)瓶頸的限制，目前對話機器人的對話質(zhì)量仍是一個技術(shù)難點，為了將對話機器人做到成熟化、產(chǎn)品化，前提是對話機器人對于對話的意圖識別需要足夠準確，因此，如何進行準確的意圖識別，是亟待解決的問題。

發(fā)明內(nèi)容

本申請的目的在于，針對上述現(xiàn)有技術(shù)中的不足，提供一種意圖識別模型訓(xùn)練方法、意圖識別方法、裝置及設(shè)備，可以提高對話機器人的意圖識別準確率。

為實現(xiàn)上述目的，本申請實施例采用的技術(shù)方案如下：

第一方面，本申請實施例提供了一種意圖識別模型訓(xùn)練方法，所述方法包括：

根據(jù)意圖識別模型所應(yīng)用的第一領(lǐng)域，獲取第一訓(xùn)練語料，所述第一訓(xùn)練語料包括所述第一領(lǐng)域的標注的語料；

使用所述第一訓(xùn)練語料，訓(xùn)練得到第一訓(xùn)練模型；

根據(jù)所述意圖識別模型所應(yīng)用的第二領(lǐng)域，獲取第二訓(xùn)練語料，所述第二領(lǐng)域為所述第一領(lǐng)域的子領(lǐng)域，所述第二訓(xùn)練語料包括所述第二領(lǐng)域的標注的語料；

使用所述第二訓(xùn)練語料訓(xùn)練所述第一訓(xùn)練模型，得到第二訓(xùn)練模型；

獲取第三訓(xùn)練語料，所述第三訓(xùn)練語料為所述第二領(lǐng)域內(nèi)標注有意圖信息的語料；

使用所述第三訓(xùn)練語料訓(xùn)練所述第二訓(xùn)練模型，得到所述意圖識別模型。

可選地，所述第三訓(xùn)練語料包括：訓(xùn)練語句、所述訓(xùn)練語句的關(guān)鍵詞以及所述訓(xùn)練語句的意圖信息。

可選地，所述第二訓(xùn)練語料包括表征所述第二領(lǐng)域的結(jié)構(gòu)信息以及知識信息。

可選地，所述使用所述第一訓(xùn)練語料，訓(xùn)練得到第一訓(xùn)練模型之前，包括：

將數(shù)據(jù)符號為半角的第一訓(xùn)練語料轉(zhuǎn)換為數(shù)據(jù)符號為全角的第一訓(xùn)練語料。

可選地，所述根據(jù)意圖識別模型所應(yīng)用的第二領(lǐng)域，獲取第二訓(xùn)練語料，包括：

根據(jù)所述意圖識別模型所應(yīng)用的第二領(lǐng)域以及所述第一訓(xùn)練語料，獲取所述第二訓(xùn)練語料。

可選地，所述根據(jù)所述意圖識別模型所應(yīng)用的第二領(lǐng)域以及所述第一訓(xùn)練語料，獲取所述第二訓(xùn)練語料，包括：

根據(jù)所述第二領(lǐng)域的數(shù)據(jù)結(jié)構(gòu)，從所述第一訓(xùn)練語料中篩選出符合所述數(shù)據(jù)結(jié)構(gòu)的所述第二訓(xùn)練語料。

可選地，所述獲取第三訓(xùn)練語料，包括：

從預(yù)設(shè)的關(guān)鍵詞庫中提取與所述訓(xùn)練語句匹配的關(guān)鍵詞，得到所述訓(xùn)練語句的關(guān)鍵詞；

對所述訓(xùn)練語句進行意圖標注，得到所述訓(xùn)練語句的意圖信息；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于陽光保險集團股份有限公司，未經(jīng)陽光保險集團股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011135184.4/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06F 電數(shù)字數(shù)據(jù)處理

免登錄下載普通用戶下載升級VIP會員，免費下載

滑坡模型實驗?zāi)Ｐ图?/a>

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】