[發(fā)明專利]一種隱含語篇關(guān)系的分類方法有效
| 申請?zhí)枺?/td> | 202110843643.2 | 申請日: | 2021-07-26 |
| 公開(公告)號: | CN113590821B | 公開(公告)日: | 2023-04-14 |
| 發(fā)明(設(shè)計)人: | 劉杰;馬宇昊;周建設(shè);張凱;張磊 | 申請(專利權(quán))人: | 北方工業(yè)大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/211;G06F40/30;G06N3/0464;G06N3/08 |
| 代理公司: | 北京挺立專利事務(wù)所(普通合伙) 11265 | 代理人: | 蔡宗慧 |
| 地址: | 100144 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 隱含 關(guān)系 分類 方法 | ||
本發(fā)明涉及一種隱含語篇關(guān)系的分類方法,包括:針對待分類的第一語篇信息和第二語篇信息,基于隱式語篇關(guān)系分類模型,獲取第一語篇信息和第二語篇信息中語義信息的語義交互圖結(jié)構(gòu);針對所述語義交互圖結(jié)構(gòu),獲取與第一語篇信息和第二語篇信息對應(yīng)的語義特征;將獲取的語義特征借助于指數(shù)映射投影到雙曲空間中,獲取所述第一語篇信息和第二語篇信息的分類結(jié)果;其中,所述隱式語篇關(guān)系分類模型為預先建立并訓練的包括有上下文表示層、語義學習層、卷積層、聚合層和預測層的模型;所述上下文表示層、語義學習層執(zhí)行獲取語義交互圖結(jié)構(gòu)的過程,所述語義學習層、卷積層和所述聚合層執(zhí)行獲取語義特征的過程,所述預測層執(zhí)行獲取分類結(jié)果的過程。
技術(shù)領(lǐng)域
本發(fā)明涉及隱含語篇關(guān)系分類技術(shù)領(lǐng)域,尤其涉及一種隱含語篇關(guān)系的分類方法。
背景技術(shù)
語篇關(guān)系分類旨在識別兩個文本跨度之間的邏輯關(guān)系。它是語篇解析的一項基本任務(wù),對許多自然語言處理任務(wù)都是有益的,例如機器翻譯、問答系統(tǒng)和文本生成。根據(jù)語篇實例中是否包含連接詞,語篇關(guān)系分類任務(wù)分為兩種:句子中包含連接詞的顯式語篇關(guān)系分類和句中不含連接詞的隱含語篇關(guān)系分類。僅使用連接詞作為特征,顯式語篇關(guān)系分類任務(wù)的準確率超過93%。對于隱含語篇關(guān)系分類來說,由于缺少連接詞,識別隱性關(guān)系往往依賴于兩個句子的相關(guān)語義信息,該任務(wù)仍然具有挑戰(zhàn)性。
為了解決這個問題,研究人員對隱含語篇關(guān)系分類做了大量的研究。但是現(xiàn)有的方法難以處理不規(guī)則語法和隱藏特征、忽略了更廣泛的句子線索,例如,句法結(jié)構(gòu)和上下文信息等,沒有充分利用注釋過的語篇關(guān)系信息。同時,現(xiàn)有的方法通常會遇到數(shù)據(jù)稀疏性問題,從而使其效率低下。
發(fā)明內(nèi)容
(一)要解決的技術(shù)問題
鑒于現(xiàn)有技術(shù)的上述缺點、不足,本發(fā)明提供一種隱含語篇關(guān)系的分類方法,其解決了現(xiàn)有的方法沒有考慮句法結(jié)構(gòu)和上下文信息導致語篇關(guān)系分類結(jié)果不準確的技術(shù)問題。
(二)技術(shù)方案
為了達到上述目的,本發(fā)明采用的主要技術(shù)方案包括:
本發(fā)明實施例提供一種隱含語篇關(guān)系的分類方法,包括:
S1、針對待分類的第一語篇信息和第二語篇信息,基于隱式語篇關(guān)系分類模型,獲取第一語篇信息和第二語篇信息中語義信息的語義交互圖結(jié)構(gòu);
所述語義交互圖結(jié)構(gòu)中的句內(nèi)邊表示句法依賴關(guān)系,交互邊表示第一語篇信息的節(jié)點和第二語篇信息的節(jié)點在當前句子對中具有的語義關(guān)聯(lián)關(guān)系,節(jié)點為語篇信息的單詞;
S2、針對所述語義交互圖結(jié)構(gòu),獲取與第一語篇信息和第二語篇信息對應(yīng)的語義特征;
S3、將獲取的語義特征借助于指數(shù)映射投影到雙曲空間中,獲取所述第一語篇信息和第二語篇信息的分類結(jié)果;
其中,所述隱式語篇關(guān)系分類模型為預先建立并訓練的包括有上下文表示層、語義學習層、卷積層、聚合層和預測層的模型;
所述上下文表示層、語義學習層執(zhí)行獲取語義交互圖結(jié)構(gòu)的過程,所述語義學習層、卷積層和所述聚合層執(zhí)行獲取語義特征的過程,所述預測層執(zhí)行獲取分類結(jié)果的過程。
優(yōu)選的,S1具體包括:
所述隱式語篇關(guān)系分類模型的上下文表示層針對待分類的第一語篇信息和第二語篇信息提取與第一語篇信息對應(yīng)的第一語篇信息表示向量組和與第二語篇信息對應(yīng)的第二語篇信息表示向量組;
其中,所述第一語篇信息表示向量組包括分別與所述第一語篇信息中的單詞一一對應(yīng)的具有上下文特征的編碼向量;所述第二語篇信息表示向量組包括分別與所述第二語篇信息中的單詞一一對應(yīng)的具有上下文特征的編碼向量;
所述隱式語篇關(guān)系分類模型的語義學習層基于第一語篇信息表示向量組和第二語篇信息表示向量組,采用預先設(shè)定的構(gòu)圖策略構(gòu)建語義交互圖結(jié)構(gòu)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北方工業(yè)大學,未經(jīng)北方工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110843643.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種隱含代碼信息裝置
- 一種基于有社會關(guān)系和項目內(nèi)容的貝葉斯概率矩陣分解推薦方法
- 文本挖掘系統(tǒng)、文本挖掘方法和程序
- 神經(jīng)網(wǎng)絡(luò)優(yōu)化方法
- 一種基于BP神經(jīng)網(wǎng)絡(luò)調(diào)節(jié)PI控制器參數(shù)的電路及方法
- 基于上下文轉(zhuǎn)換向量模型的推薦方法和系統(tǒng)
- 訓練卷積神經(jīng)網(wǎng)絡(luò)模型的方法、裝置及存儲介質(zhì)
- 一種新型基于期權(quán)隱含波動率變動的報價模式
- 一種視頻編解碼方法、裝置及終端設(shè)備
- 一種考慮擾動的隱含故障診斷方法及系統(tǒng)





