[發明專利]一種分層選擇槽位相關上下文的對話狀態生成方法及裝置有效
| 申請號: | 202111024342.3 | 申請日: | 2021-09-02 |
| 公開(公告)號: | CN113742467B | 公開(公告)日: | 2023-08-08 |
| 發明(設計)人: | 黃浩;謝紅巖 | 申請(專利權)人: | 新疆大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06N3/0442;G06N3/0475;G06N3/08 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李林娟 |
| 地址: | 830046 新疆維*** | 國省代碼: | 新疆;65 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 分層 選擇 位相 關上 下文 對話 狀態 生成 方法 裝置 | ||
1.一種分層選擇槽位相關上下文的對話狀態生成方法,其特征在于,所述方法包括:
使用門控循環單元編碼對話輪向量獲得對話輪級隱含狀態序列,利用多步選擇判斷槽值所在的對話輪;
利用融合門控將槽位感知上下文向量和槽位向量融合獲得重新表述的槽位向量;通過多步選擇輸出每個對話輪包含槽值的概率;
將槽位向量作為門控循環單元的初始輸入,在生成槽值的每個時間步中,將上一步生成的單詞標簽的詞向量輸入到狀態生成器獲得當前的隱含狀態;
采用加權復制機制將對話輪包含槽值的概率和從對話輪復制一個單詞的概率分布相乘,獲得從對話歷史中復制單詞的概率分布,進而預測當前時刻的單詞標簽;
其中,所述多步選擇具體為:
在第τ步使用注意機制作為選擇器,在每一步生成回合級上下文向量:
其中,是可學習的參數,為槽位與每個對話輪之間的匹配分數,為歸一化后的槽位與每個對話輪之間的匹配分數;cτ為第τ步對話輪級上下文向量,tanh為激活函數;dh為隱含狀態的維度;sτ為槽位向量;為對話輪的句子級表示;R為系統響應;Di為串聯單詞序列;使用單向門控循環單元存儲對話輪級上下文向量,獲得槽位感知上下文向量zτ:
zτ=GRU(cτ,zτ-1),
使用融合門來組合當前槽位向量hs和槽位感知的上下文向量zτ,為下一次選擇生成新的槽位向量sτ:
gt=Sigmoid(Wf·[zτ;hs])
其中,為可學習的參數;Sigmoid為激活函數;gt為融合門控是數值大小在0和1之間的標量。
2.根據權利要求1所述的一種分層選擇槽位相關上下文的對話狀態生成方法,其特征在于,所述加權復制機制具體為:
其中,從對話歷史中復制一個單詞的概率分布,表示從對話輪i中復制一個單詞的概率分布。
3.一種分層選擇槽位相關上下文的對話狀態生成裝置,其特征在于,所述裝置包括:處理器和存儲器,所述存儲器中存儲有程序指令,所述處理器調用存儲器中存儲的程序指令以使裝置執行權利要求1-2中的任一項所述的方法步驟。
4.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序包括程序指令,所述程序指令被處理器執行時使所述處理器執行權利要求1-2中的任一項所述的方法步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新疆大學,未經新疆大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111024342.3/1.html,轉載請聲明來源鉆瓜專利網。





