[發明專利]基于意圖門的任務型多輪對話方法及系統在審
| 申請號: | 202111193760.5 | 申請日: | 2021-10-13 |
| 公開(公告)號: | CN114036268A | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 朱亞杰;盧宏濤 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F16/36;G06N5/04 |
| 代理公司: | 上海段和段律師事務所 31334 | 代理人: | 李佳俊;郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 意圖 任務 輪對 方法 系統 | ||
本發明提供一種基于意圖門的任務型多輪對話方法及系統,涉及自然語言處理技術領域,該方法包括:步驟S1:根據業務需求收集相應用戶語料并進行預處理;步驟S2:根據所述用戶語料定義相應意圖、詞槽和意圖門標簽;步驟S3:訓練和優化意圖識別模型、詞槽語義填充模型和意圖門模型;步驟S4:對意圖識別模型、詞槽語義填充模型和意圖門模型進行推理;步驟S5:通過意圖識別模型和詞槽語義填充模型識別該用戶語料的意圖和提取相應詞槽,若詞槽已填完,通過當前意圖調用相應的信源服務作出回復;若詞槽未填完,則進行多輪任務直至所有詞槽填完。本發明能夠保證任務型多輪對話的正確性和提升人機對話的用戶體驗。
技術領域
本發明涉及自然語言處理技術領域,具體地,涉及一種基于意圖門的任務型多輪對話方法及系統。
背景技術
隨著互聯網和人工智能的發展,智能語音交互也越來越廣泛,而在語音交互中,對語義的識別以及信息的處理極為重要。在傳統的智能語音交互技術中,通常是僅對用戶的單句語音信息進行識別,而無法實現語義信息的傳遞以及融合。
多輪對話任務是自然語言處理中最具有實用價值的技術之一,該任務要求系統在產生通順回答語句的同時能夠照顧到上下文信息。近年來,出現了一大批以HRED(hierarchical recurrent encoder-decoder)模型為基礎的多輪對話模型,其運用多層級的循環神經網絡來編碼上下文信息,并在Movie-DiC等英文對話數據集上取得了不錯的結果。但是需要非常大的任務型多輪對話語料、超強計算力且性能較差。
公開號為CN112905749A的發明專利,公開了一種基于意圖-槽值規則樹的任務型多輪對話方法,根據標準多輪對話語料的業務規則,建立由意圖-槽值聯合信息為根和葉、槽值信息為中間結點的意圖-槽值規則樹,在對話過程中,采用神經網絡方法提取用戶語句中的意圖和槽值,并以深度優先遍歷意圖-槽值規則樹的方式進行對話,從而有效地將業務規則與神經網絡方法進行了結合。其雖然能夠支持任務多輪對話的業務持續進行,但卻只能在特定的場景下應用,具有局限性。
發明內容
針對現有技術中的缺陷,本發明提供一種基于意圖門的任務型多輪對話方法及系統。
根據本發明提供的一種基于意圖門的任務型多輪對話方法及系統,所述方案如下:
第一方面,提供了一種基于意圖門的任務型多輪對話方法,所述方法包括:
步驟S1:根據業務需求收集相應用戶語料并進行預處理;
步驟S2:根據所述用戶語料定義相應意圖、詞槽和意圖門標簽;
步驟S3:訓練和優化意圖識別模型、詞槽語義填充模型和意圖門模型;
步驟S4:對意圖識別模型、詞槽語義填充模型和意圖門模型進行推理;
步驟S5:通過意圖識別模型和詞槽語義填充模型識別該用戶語料的意圖和提取相應詞槽,若詞槽已填完,通過當前意圖調用相應的信源服務作出回復;
若詞槽未填完,則進行多輪任務直至所有詞槽填完。
優選的,所述步驟S1中用戶語料是通過生產環境進行收集的,所述預處理包括清洗臟亂差和沒有實際語義的用戶語料。
優選的,所述步驟S2包括:
步驟S2.1:定義意圖、詞槽和意圖門標簽,通過用戶語料知道這些語料所對應的領域,結合業務需求定義相應意圖、詞槽和意圖門標簽;
步驟S2.2:標注意圖、詞槽和意圖門。
優選的,所述步驟S3包括:
步驟S3.1:訓練意圖識別、詞槽語義填充和意圖門模型:將每個領域的語料按照8:1:1的比例進行劃分,再把每個領域語料的8份作為訓練集,每個領域語料的1份作為驗證集,另每個領域語料的1份作為測試集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111193760.5/2.html,轉載請聲明來源鉆瓜專利網。





