[發明專利]一種面向任務型對話的多域請求式意圖識別方法有效
| 申請號: | 202110296459.0 | 申請日: | 2021-03-19 |
| 公開(公告)號: | CN113076758B | 公開(公告)日: | 2023-03-14 |
| 發明(設計)人: | 謝洪途;林奕全;王國倩 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06F40/35 | 分類號: | G06F40/35;G06F40/284 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 劉俊 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 任務 對話 請求 意圖 識別 方法 | ||
1.一種面向任務型對話的多域請求式意圖識別方法,其特征在于,包括以下步驟:
S1:獲取對話數據,從對話數據中獲取實體ID集合E={1,2,…,C}和對話歷史U={u1,u2,…,ut},并對對話歷史進行分詞;
S2:隨機采樣一批步驟S1已分詞的對話歷史,與實體ID構成樣本對,通過雙編碼器模型分別對對話歷史及實體ID進行特征提取,得到正樣本i對應的查詢表征及實體ID的碼本表征分別為qi=E(Ui)∈Rd和Z={z1,z2,…,zC}∈R|E|×d;
S3:通過步驟S2得到的批樣本對的高維表征,根據實體級層級標簽計算樣本對重要性,并進行實體級表征三元組的挖掘:
Triplesi,local={(qi,zi,qi,1-),(qi,zi,qi,2-),…,(qi,zi,qi,M-)}
其中,qi為正樣本i對應的查詢表征,q,M-為樣本i的第M個負樣本對應的查詢表征,zi為正樣本i錨定的碼本表征,最后計算實體級局部損失函數
S4:通過步驟S2得到的批樣本對的高維表征,根據域級層級標簽計算樣本對重要性,并進行域級表征三元組的挖掘:
Triplesglobal=q1,z1,q1-,q2,z2,q2-,…,qN,zN,qN-}}
其中,qN-為度量空間中與zN相似度最高的異域樣本表征,最后計算域級全局損失函數
S5:計算總損失函數,
其中,β、γ為可調參數,為碼本損失函數,用于對碼本嵌入進行更新,最后,通過總損失函數優化雙編碼器模型,重復步驟S2-S5直至達到設定的最大迭代次數;
S6:停止迭代雙編碼器模型,并用于請求式意圖識別。
2.根據權利要求1所述的面向任務型對話的多域請求式意圖識別方法,其特征在于,步驟S2中的輸入對話歷史U={u1,u2,…,ut}包含多輪交互,每輪交互由用戶及發言者的對話語句構成,待識別的意圖即為實體ID集合E={1,2,…,C}。
3.根據權利要求1所述的面向任務型對話的多域請求式意圖識別方法,其特征在于,步驟S3-S4中,對于由輸入對話歷史和實體ID中構成的樣本對,定義度量相似度為兩者于度量空間的L2距離,查詢表征在度量空間與相應的碼本表征進行最近鄰匹配:
sim(qi,qj)=||qi-qj||2
其中,qi,qj為樣本對(i,j)對應的查詢表征,ze為實體e∈E對應的碼本表征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110296459.0/1.html,轉載請聲明來源鉆瓜專利網。





