[發明專利]一種隱含語篇關系的分類方法有效
| 申請號: | 202110843643.2 | 申請日: | 2021-07-26 |
| 公開(公告)號: | CN113590821B | 公開(公告)日: | 2023-04-14 |
| 發明(設計)人: | 劉杰;馬宇昊;周建設;張凱;張磊 | 申請(專利權)人: | 北方工業大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/211;G06F40/30;G06N3/0464;G06N3/08 |
| 代理公司: | 北京挺立專利事務所(普通合伙) 11265 | 代理人: | 蔡宗慧 |
| 地址: | 100144 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 隱含 關系 分類 方法 | ||
1.一種隱含語篇關系的分類方法,其特征在于,包括:
S1、針對待分類的第一語篇信息和第二語篇信息,基于隱式語篇關系分類模型,獲取第一語篇信息和第二語篇信息中語義信息的語義交互圖結構;
所述語義交互圖結構中的句內邊表示句法依賴關系,交互邊表示第一語篇信息的節點和第二語篇信息的節點在當前句子對中具有的語義關聯關系,節點為語篇信息的單詞;
S2、針對所述語義交互圖結構,獲取與第一語篇信息和第二語篇信息對應的語義特征;
S3、將獲取的語義特征借助于指數映射投影到雙曲空間中,獲取所述第一語篇信息和第二語篇信息的分類結果;
其中,所述隱式語篇關系分類模型為預先建立并訓練的包括有上下文表示層、語義學習層、卷積層、聚合層和預測層的模型;
所述上下文表示層、語義學習層執行獲取語義交互圖結構的過程,所述語義學習層、卷積層和所述聚合層執行獲取語義特征的過程,所述預測層執行獲取分類結果的過程;
S1具體包括:
所述隱式語篇關系分類模型的上下文表示層針對待分類的第一語篇信息和第二語篇信息提取與第一語篇信息對應的第一語篇信息表示向量組和與第二語篇信息對應的第二語篇信息表示向量組;
其中,所述第一語篇信息表示向量組包括分別與所述第一語篇信息中的單詞一一對應的具有上下文特征的編碼向量;所述第二語篇信息表示向量組包括分別與所述第二語篇信息中的單詞一一對應的具有上下文特征的編碼向量;
所述隱式語篇關系分類模型的語義學習層基于第一語篇信息表示向量組和第二語篇信息表示向量組,采用預先設定的構圖策略構建語義交互圖結構;
所述隱式語篇關系分類模型的上下文表示層針對待分類的第一語篇信息和第二語篇信息提取與第一語篇信息對應的第一語篇信息表示向量組和與第二語篇信息對應的第二語篇信息表示向量組,具體包括:
所述隱式語篇關系分類模型的上下文表示層采用預先設定的BERT模型分別對第一語篇信息和第二語篇信息進行處理,獲取與第一語篇信息對應的第一單元組arg1和與第二語篇信息對應的第二單元組arg2;
其中,所述第一單元組arg1為:
所述第二單元組arg2為:
M是arg1的長度;且M為預先設定的;
N是arg2的長度;且N為預先設定的;
是Argi中第kth個單詞的token;
CLS和EOS分別是BERT模型中的嵌入的token;
將所述第一單元組arg1和所述第二單元組arg2進行拼接,獲取第三單元組;
所述第三單元組為:
SEP是標明語篇單元連接邊界的嵌入標記;
所述BERT模型中的編碼器對所述第三單元組進行處理,獲取與第一語篇信息和第二語篇信息對應的向量組;
所述與第一語篇信息和第二語篇信息對應的向量組為:
[h0,h1,...,hM+N+2,hM+N+3];
hn表示第三單元組中第n個token或嵌入標記所對應的具有上下文特征的編碼向量;
基于第一語篇信息和第二語篇信息對應的向量組,獲取與第一語篇信息對應的第一語篇信息表示向量組和與第二語篇信息對應的第二語篇信息表示向量組;
其中,所述第一語篇信息表示向量組為:[h0,h1,...,hM+1];
所述第二語篇信息表示向量組為:[hM+2,hM+3,...,hM+N+3];
所述隱式語篇關系分類模型的語義學習層基于第一語篇信息表示向量組和第二語篇信息表示向量組,采用預先設定的構圖策略構建語義交互圖結構,具體包括:
所述隱式語篇關系分類模型的語義學習層采用Standford?CoreNLP解析器分別針對第一語篇信息表示向量組和第二語篇信息表示向量組進行句法分析,分別獲取所述第一語篇信息的依存結構信息和第二語篇信息的依存結構信息;
所述第一語篇信息的依存結構信息包括:第一語篇信息中單詞的詞性信息以及各單詞之間的句法依賴關系;
所述第二語篇信息的依存結構信息包括:第二語篇信息中單詞的詞性信息以及各單詞之間的句法依賴關系;
分別基于所述第一語篇信息的依存結構信息和第二語篇信息的依存結構信息,分別獲取第一語篇信息的句法關系圖和第二語篇信息的句法關系圖;
每一句法關系圖中以相應語篇單元中的單詞和詞性作為節點,以相應語篇單元中單詞和單詞之間的句法依賴關系作為圖中的節點之間的句內邊;
基于第一語篇信息的句法關系圖和第二語篇信息的句法關系圖,構造語義交互圖結構;
所述語義交互圖結構包括第一語篇信息的句法關系圖和第二語篇信息的句法關系圖以及交互邊;
所述交互邊為在所述第一語篇信息中的任一單詞和第二語篇信息中的任一單詞之間滿足預設條件的單詞之間的邊;
所述預設條件為:表示單詞之間語義關聯關系的共現頻率低于預先設定值;
所述單詞之間的共現頻率為B(arg1i,arg2j);
其中,
B(arg1i,arg2j)是單詞對(arg1i,arg2j)的共現頻率;
其中,arg1i為arg1中的第i個token所對應的單詞;
arg2i為arg2中的第j個token所對應的單詞;
p(arg1i,arg2j)是arg1i和arg2j在預先設定的PDTB2.0語料庫中統計的一起出現的頻率;
p(arg1i)是arg1t在預先設定的PDTB2.0語料庫中單獨出現的頻率;
p(arg2j)是arg2j在預先設定的PDTB2.0語料庫中單獨出現的頻率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北方工業大學,未經北方工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110843643.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:運用柵格舵的微小型無人機及控制方法
- 下一篇:一種汽車儀表板的卡接結構





