[發明專利]一種用于意圖識別的詞義角色標注方法及系統在審
| 申請號: | 202111069148.7 | 申請日: | 2021-09-13 |
| 公開(公告)號: | CN113688627A | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 孫喜民;祁劍偉;周晶;王明達;賈江凱;王帥 | 申請(專利權)人: | 國網電子商務有限公司;國網電商科技有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/30;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 錢娜 |
| 地址: | 100053 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 意圖 識別 詞義 角色 標注 方法 系統 | ||
本發明公開了一種用于意圖識別的詞義角色標注方法及系統,方法包括:輸入句子序列、謂詞序列、謂詞上下文和謂詞上下文區域標記;將謂詞序列和謂詞上下文擴展為與句子序列長度相同的序列;將句子序列、謂詞序列、謂詞上下文和謂詞上下文區域標記轉換為詞向量序列;將句子序列、謂詞序列、謂詞上下文和謂詞上下文區域標記的詞向量序列輸入雙向LSTM模型;通過雙向LSTM模型學習輸入序列的特征表示,得到新的特征表示序列;將新的特征表示序列輸入條件隨機場;通過條件隨機場對新的特征表示序列進行標注,得到標注結果。本發明能夠有效的實現自動詞義角色標注,減少意圖識別中構建詞義標注語料庫的時間和成本。
技術領域
本發明涉及意圖識別技術領域,尤其涉及一種用于意圖識別的詞義角色標注方法及系統。
背景技術
目前,現有的詞義角色標注方法首先是從句子中剪除掉不可能成為論元的詞,然后從候選論元中識別出所有屬于該謂詞的論元,給識別出的論元標注語義角色,最后對標注結果進行處理得到語義角色標注結果。
由此可以看出,現有的詞義角色標注方法性能依賴于特征工程,需要領域知識和大量的特征提取工作,沒有特征能夠表示長距離的依賴關系,無法引入異構資源來解決數據不足的問題。
因此,如何有效的實現自動詞義角色標注,減少意圖識別中構建詞義標注語料庫的時間和成本,是一項亟待解決的問題。
發明內容
有鑒于此,本發明提供了一種用于意圖識別的詞義角色標注方法,能夠有效的實現自動詞義角色標注,減少意圖識別中構建詞義標注語料庫的時間和成本。
本發明提供了一種用于意圖識別的詞義角色標注方法,包括:
輸入句子序列、謂詞序列、謂詞上下文和謂詞上下文區域標記;
將所述謂詞序列和謂詞上下文擴展為與所述句子序列長度相同的序列;
將所述句子序列、謂詞序列、謂詞上下文和謂詞上下文區域標記轉換為詞向量序列;
將所述句子序列、謂詞序列、謂詞上下文和謂詞上下文區域標記的詞向量序列輸入雙向LSTM模型;
通過所述雙向LSTM模型學習輸入序列的特征表示,得到新的特征表示序列;
將所述新的特征表示序列輸入條件隨機場;
通過所述條件隨機場對所述新的特征表示序列進行標注,得到標注結果。
優選地,所述將所述句子序列、謂詞序列、謂詞上下文和謂詞上下文區域標記轉換為詞向量序列,包括:
將所述句子序列、謂詞序列、謂詞上下文和謂詞上下文區域標記通過詞表取詞向量轉換為實向量表示的詞向量序列,其中,所述句子序列和所述謂詞上下文共享一個詞表。
優選地,所述通過所述條件隨機場對所述新的特征表示序列進行標注,得到標注結果,包括:
通過所述條件隨機場以標記序列為監督信號,對所述新的特征表示序列進行標注,得到標注結果。
優選地,所述方法還包括:
從句子中抽取謂詞前后各n個詞構成謂詞上下文。
優選地,所述謂詞上下文用one-hot方式表示。
一種用于意圖識別的詞義角色標注系統,包括:
第一輸入模塊,用于輸入句子序列、謂詞序列、謂詞上下文和謂詞上下文區域標記;
擴展模塊,用于將所述謂詞序列和謂詞上下文擴展為與所述句子序列長度相同的序列;
轉換模塊,用于將所述句子序列、謂詞序列、謂詞上下文和謂詞上下文區域標記轉換為詞向量序列;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網電子商務有限公司;國網電商科技有限公司,未經國網電子商務有限公司;國網電商科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111069148.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可實現多方向減震的電磁減震器
- 下一篇:一種高空懸掛式電力巡檢機器人





