[發明專利]一種基于圖表征融合的問句生成方法及裝置在審
| 申請號: | 202011351764.7 | 申請日: | 2020-11-26 |
| 公開(公告)號: | CN112487761A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 方凡;周興發;饒璐;譚斌;楊蘭;孫銳;展華益 | 申請(專利權)人: | 四川長虹電器股份有限公司 |
| 主分類號: | G06F40/126 | 分類號: | G06F40/126;G06F40/211;G06F40/289;G06F40/30 |
| 代理公司: | 四川省成都市天策商標專利事務所 51213 | 代理人: | 陳藝文 |
| 地址: | 621000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖表 融合 問句 生成 方法 裝置 | ||
1.一種基于圖表征融合的問句生成方法,其特征在于,包括以下步驟:
A、初始化文本、答案的語義編碼序列;
B、通過對文本的句法分析,獲取文本每個句子的依存句法樹,構建整個文本的依存句法圖;
C、將文本信息和答案信息進行交互,為文本編碼引入答案信息,得到文本的交互編碼;
D、基于文本的依存句法圖,結合文本的交互編碼,構建文本的依存句法圖在兩個方向的圖表征;
E、將文本在依存句法圖兩個方向的圖表征進行融合,得到最終的圖表征;
F、根據文本的依存句法圖表征,利用問句生成模塊生成問句序列。
2.如權利要求1所述的一種基于圖表征融合的問句生成方法,其特征在于,所述步驟A中初始化語義編碼序列的方法包括:采用詞向量隨機初始化的表示方法,或基于深度學習的語言模型訓練得到的向量表示方法。
3.如權利要求1所述的一種基于圖表征融合的問句生成方法,其特征在于,所述步驟B中獲取文本每個句子的依存句法樹的方法包括:對句子進行依存句法分析。
4.如權利要求1所述的一種基于圖表征融合的問句生成方法,其特征在于,所述步驟B中構建整個文本的依存句法圖的方法包括:多棵依存句法樹合并為依存句法圖。
5.如權利要求1所述的一種基于圖表征融合的問句生成方法,其特征在于,所述步驟C中將文本信息和答案信息進行交互的方法包括:對步驟A中得到的文本詞向量和答案詞向量進行深度對齊。
6.如權利要求1所述的一種基于圖表征融合的問句生成方法,其特征在于,所述步驟D中構建文本基于依存句法圖的兩個方向圖表征的方法包括:利用自回歸模型迭代計算圖表征。
7.如權利要求1所述的一種基于圖表征融合的問句生成方法,其特征在于,所述步驟E中將文本在依存句法圖兩個方向的圖表征進行融合的方法包括:多個單詞的圖表征融合為一個句子圖表征、兩個方向的圖表征融合。
8.如權利要求1所述的一種基于圖表征融合的問句生成方法,其特征在于,所述步驟F中所述問句生成模塊的方法包括:基于循環神經網絡的解碼模塊,文本表征和解碼模塊輸出之間的注意力交互。
9.如權利要求1所述的一種基于圖表征融合的問句生成方法,其特征在于,還包括將詞向量輸入所述問句生成模塊進行訓練的方法,包括:所述問句生成模塊損失函數的設定、迭代更新,所述問句生成模塊參數的方法的設定,對所述問句生成模塊中各層參數的初始化,各個網絡層之間的連接以及對齊。
10.一種基于圖表征的問句生成裝置,其特征在于,包括:
語義編碼初始化模塊,用于對輸入的文本和答案進行分詞,然后將單詞轉化為對應的詞向量;
句法分析模塊,用于對文本進行依存句法分析,生成對應的依存句法圖;
文本與答案交互模塊,用于將答案信息與文本信息進行交互,得到包含答案信息的文本向量;
基于依存句法的圖表征構建模塊,用于構建文本的基于依存句法關系的圖表征;
圖表征信息融合模塊,用于對整個文本在兩個方向的圖表征進行融合,同時對文本所有單詞的圖表征進行融合;
問句生成模塊,用于在得到文本的圖表征之后對其進行解碼并生成質量最優的問句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川長虹電器股份有限公司,未經四川長虹電器股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011351764.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種半導體用晶圓QDR槽
- 下一篇:一種氯化亞鐵溶液連續除雜凈化的方法





