[發明專利]一種融合短語先驗知識的依存句法分析方法及裝置有效
| 申請號: | 202011123436.1 | 申請日: | 2020-10-20 |
| 公開(公告)號: | CN112016301B | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 張丹;石霖;董曉飛;曹峰;孫明俊 | 申請(專利權)人: | 南京新一代人工智能研究院有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/289 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 短語 先驗 知識 依存 句法 分析 方法 裝置 | ||
本發明公開了一種融合短語先驗知識的依存句法分析方法,先標記不同詞性短語的邊界,對不同詞性短語數據進行依存句法分析,分別訓練得到不同詞性短語的句法分析模型;將邊界標記后的不同詞性的短語作為短語識別訓練語料,訓練得到短語識別模型;對短語識別訓練語料進行短語內的依存句法分析,得到短語內依存句法信息,將其作為先驗知識訓練句法分析模型;測試過程中,將待分析句子輸入到短語識別模型中,將句中不同短語部分輸入到不同詞性短語的句法分析模型中,得到短語內依存句法信息,將其輸入到融合短語先驗知識的句法分析模型中,輸出整句的依存句法分析結果。本發明還提供了基于該方法的依存句法分析裝置。本發明能夠提高句法分析準確率。
技術領域
本發明屬于自然語言處理技術領域,尤其涉及一種融合短語先驗知識的依存句法分析方法及裝置。
背景技術
句法分析是自然語言處理中的關鍵底層技術之一,基本任務是確定句子的句法結構或者句子中詞匯之間的依存關系。句法分析可以應用于信息檢索、機器翻譯、情感分析等任務中。目前,常用的句法分析方法有成分句法分析和依存句法分析兩種,依存句法具有表現形式簡單易懂、易于標注、接近語義關系的優勢。
現有的依存句法分析存在語料數據稀疏、長距離依存分析準確率低等問題。
發明內容
發明目的:本發明提出一種高準確率的依存句法分析方法。本發明的另一目的在于提出基于該方法的依存句法分析裝置。
技術方案:本發明所采述的融合短語先驗知識的依存句法分析方法,該方法包括:
(1)根據依存句法關系對依存句法分析訓練數據進行不同詞性短語的邊界標記,對不同詞性短語進行依存句法分析,分別訓練得到不同詞性短語的句法分析模型;
(2)將邊界標記后的不同詞性短語作為短語識別訓練語料,訓練得到短語識別模型;
(3)對所述短語識別訓練語料進行短語內的依存句法分析,得到短語內依存句法信息,構建包含短語內依存句法信息的句法分析訓練語料,訓練得到融合短語先驗知識的句法分析模型;
(4)將待分析句子輸入所述短語識別模型,識別出所述待分析句子中的不同詞性短語,利用所述不同詞性短語的句法分析模型識別出不同詞性短語內部的依存句法關系,將識別出的不同詞性短語內部的依存句法關系輸入到所述融合短語先驗知識的句法分析模型中,輸出待分析句子的依存句法分析結果。
本發明通過所述短語識別模型先將待分析句子的長度進行縮短,以降低后續對待分析句子整句進行依存句法分析的難度。
進一步地,所述詞性包括介詞、名詞。
進一步地,所述依存句法關系主要包括:主謂關系(SBJ)、動賓關系(COMP)、介賓關系(OBJ)、連動關系(AUX)、并列關系(CJTN)、定中關系(AMOD)、復合名詞修飾關系(NMOD),狀中關系中動詞修飾動詞(ADV)、介詞短語修飾動詞(位置LOC、方式MNR、對象DIR)。
進一步地,所述依存句法分析訓練數據為對句子進行分詞、詞性標注后的數據。
進一步地,所述步驟(1)包括:根據依存句法關系得到依存句法樹,判斷依存于根節點且為狀中關系的介詞,找到依存于所述介詞的最右節點,進行標記。
進一步地,所述步驟(1)包括:根據依存句法關系得到依存句法樹,判斷依存于根節點且為主謂關系或動賓關系的名詞是否存在依存于所述名詞且為定中關系或復合名詞修飾關系的詞,若存在則找到依存于該詞的最左及最右節點,進行標記。
本發明所述的融合短語先驗知識的依存句法分析裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京新一代人工智能研究院有限公司,未經南京新一代人工智能研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011123436.1/2.html,轉載請聲明來源鉆瓜專利網。





