[發明專利]一種基于知識圖譜與語義圖技術的口語理解方法有效
| 申請號: | 201910315854.1 | 申請日: | 2019-04-19 |
| 公開(公告)號: | CN110188342B | 公開(公告)日: | 2020-04-07 |
| 發明(設計)人: | 姜明;滕海濱;張旻;湯景凡;戚鋮杰;張雯 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/36;G06F16/35 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 語義 技術 口語 理解 方法 | ||
1.一種基于知識圖譜與語義圖技術的口語理解方法,其特征在于包括以下步驟:
步驟1、訓練序列到動作序列神經網絡模型,訓練基于句子和句子邏輯表達式的口語理解神經網絡;
步驟2、讀取需要被解析的自然語言句子;
步驟3、使用文本映射算法掃描并替換句子中與知識圖譜中語義資源相匹配的部分;
步驟4、使用序列到動作序列神經網絡模型讀取替換了語義資源后的句子,然后執行對應的動作序列生成與替換了語義資源后的句子語義相符的語義圖,然后使用深度優先算法遍歷語義圖得到替換了語義資源后的句子的邏輯表達式;
步驟5、使用口語理解神經網絡讀入替換了語義資源后的句子和邏輯表達式,生成意圖信息和槽位信息。
2.根據權利要求1所述的一種基于知識圖譜與語義圖技術的口語理解方法,其特征在于步驟1中訓練的序列到動作序列神經網絡模型,包括如下步驟:
1-1.整理出已有的句子與邏輯表達式的關系作為樣本集;
1-2.解析句子邏輯表達式生成語義圖,對語義圖進行深度優先搜索生成構造語義圖的動作序列;
1-3.將句子本身與邏輯表達式生成的動作序列做對應,生成一個新的樣本集;
1-4.將句子與動作序列的樣本集,分割為比例為9:1作為訓練集與測試集;訓練集送入一個序列到動作序列的神經網絡模型中,通過梯度下降算法調整模型參數,使得模型在測試集中的測試結果達到最優;
步驟1中所述的口語理解神經網絡,包括如下步驟:
1-1整理已有句子的邏輯表達式與句子的意圖信息和槽位信息做對應,整理為樣本集;
1-2同樣將樣本集分割為9∶1作為訓練集與測試集;
1-3使用口語理解神經網絡在訓練集中進行學習,然后在測試集中測試結果;調整參數使用梯度下降法,使得最終槽位信息和意圖信息更加準確。
3.根據權利要求1或2所述的一種基于知識圖譜與語義圖技術的口語理解方法,步驟1或5中的口語理解神經網絡,其特征在于,構建一個編碼器、解碼器結構的循環神經網絡,具體如下:
①使用LSTM作為神經網絡中的單元;
②編碼器結構滿足:
hi=LSTM(φ(x)(xi),hi-1) (1)
其中,hi表示對應于輸入詞語xi的隱藏層狀態,LSTM指長短時記憶網絡的狀態轉移方程;φ(x)(xi)表示對于輸入詞語xi映射到詞向量;
③解碼器結構滿足:
P(yj=w|x,y1:j-1)∝exp(Uw[sj,cj]) (6)
sj+1=LSTM([φ(y)(yj),cj],sj) (7)
其中,sj表示輸出步驟為j時的隱藏層狀態;表示在序列長度為m的序列上,取正向RNN序列的第m個隱藏層數據,與反向RNN序列中第1個隱藏層的數據拼接,通過解碼器隱藏層轉換函數計算得到第一個解碼器隱藏層狀態s1;
eij表示在輸出步驟為j時,輸入序列第i個單詞的注意力評分;其計算過程需要用到輸出狀態sj的轉置以及經過注意力轉換函數轉換輸入詞語序列中詞語xi的隱藏層狀態bi;
aij指輸出步驟為i時的詞語xj的注意力權重;其中exp指指數函數;yj為輸出步驟j的輸出結果。
4.根據權利要求3所述的一種基于知識圖譜與語義圖技術的口語理解方法,步驟1或5中的口語理解神經網絡,其特征在于構建一個同時讀入句子本身與其邏輯表達式的神經網絡,進行意圖猜測和槽位解析,具體包括:
(1)邏輯表達式信息提取,邏輯表達式序列對應的前向隱藏層狀態lfh=[lfh1,lfh2,lfh3,…,lfh|L|]滿足:
類似的,反向隱藏層狀態lbh=[lbh1,lbh2,lbh3,…,lbh|L|]同樣滿足:
邏輯表達式的最終描述結果sL=[lfh|L|,lbh1]
LSTM表示長短時記憶網絡的狀態轉移方程,φl(li)表示邏輯表達式序列單元li在映射方程φl計算下得到對應向量;
(2)進行槽位填充時,更新過程滿足:
s0=tanh(W(s)(sL))
(4.17)
si=f(s)(si-1,yi-1,hi,ci)
(4.18)
ei,k=g(si-1,hk)
(4.21)
其中yi-1表示生成的標簽序列的第i-1個值;在輸出時刻i,ci表示注意力機制下的輸入,si表示當前隱藏層狀態;W(s)表示隱藏層狀態初始化方程,參數sL來自上述步驟(1)中的計算結果;ci表示當前注意力機制下的輸入值,ai,j表示當前步驟下輸入詞語xj的注意力得分,ei,k表示詞語xk的權重,根據權重換算公式g計算上一時刻狀態si-1與詞語隱藏層狀態hk得到;
(3)意圖解析是對所有的隱藏層狀態s=(s1,s2,...,s|w|)匯總,分類,輸出意圖信息的分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910315854.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種警情分析系統
- 下一篇:基于融合注意力網絡的多模態情感識別方法





