[發明專利]一種融合短語先驗知識的依存句法分析方法及裝置有效
| 申請號: | 202011123436.1 | 申請日: | 2020-10-20 |
| 公開(公告)號: | CN112016301B | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 張丹;石霖;董曉飛;曹峰;孫明俊 | 申請(專利權)人: | 南京新一代人工智能研究院有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/289 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 短語 先驗 知識 依存 句法 分析 方法 裝置 | ||
1.一種融合短語先驗知識的依存句法分析方法,其特征在于,包括步驟:
(1)根據依存句法關系對依存句法分析訓練數據進行不同詞性短語的邊界標記,對不同詞性短語進行依存句法分析,分別訓練得到不同詞性短語的句法分析模型;
(2)將邊界標記后的不同詞性短語作為短語識別訓練語料,訓練得到短語識別模型;
(3)對所述短語識別訓練語料進行短語內的依存句法分析,得到短語內依存句法信息,構建包含短語內依存句法信息的句法分析訓練語料,訓練得到融合短語先驗知識的句法分析模型;
(4)將待分析句子輸入所述短語識別模型,識別出所述待分析句子中的不同詞性短語,利用所述不同詞性短語的句法分析模型識別出不同詞性短語內部的依存句法關系,將識別出的不同詞性短語內部的依存句法關系輸入到所述融合短語先驗知識的句法分析模型中,輸出待分析句子的依存句法分析結果。
2.根據權利要求1所述的融合短語先驗知識的依存句法分析方法,其特征在于:所述詞性包括介詞、名詞。
3.根據權利要求1所述的融合短語先驗知識的依存句法分析方法,其特征在于,所述依存句法分析訓練數據為對句子進行分詞、詞性標注后的數據。
4.根據權利要求1所述的融合短語先驗知識的依存句法分析方法,其特征在于,所述步驟(1)包括:根據依存句法關系得到依存句法樹,判斷依存于根節點且為狀中關系的介詞,找到依存于所述介詞的最右節點,進行標記。
5.根據權利要求1所述的融合短語先驗知識的依存句法分析方法,其特征在于,所述步驟(1)包括:根據依存句法關系得到依存句法樹,判斷依存于根節點且為主謂關系或動賓關系的名詞是否存在依存于所述名詞且為定中關系或復合名詞修飾關系的詞,若存在則找到依存于該詞的最左及最右節點,進行標記。
6.一種基于權利要求1所述分析方法的依存句法分析裝置,其特征在于,包括:
預處理模塊,用于根據依存句法關系對依存句法分析訓練數據進行不同詞性短語的邊界標記,構建短語識別訓練語料;對所述短語識別訓練語料進行短語內的依存句法分析,得到短語內依存句法信息,構建包含短語內依存句法信息的句法分析訓練語料;
訓練模塊,用于對不同詞性短語數據進行依存句法分析,分別訓練得到對應詞性短語的句法分析模型;利用構建的短語識別訓練語料訓練得到短語識別模型;利用構建的包含短語內依存句法信息的句法分析訓練語料訓練得到融合短語先驗知識的句法分析模型;
分析模塊,用于將待分析句子輸入所述短語識別模型,識別出所述待分析句子中的不同詞性短語,利用所述不同詞性短語的句法分析模型識別出不同詞性短語內部的依存句法關系,將識別出的不同詞性短語內部的依存句法關系輸入到所述融合短語先驗知識的句法分析模型中,輸出待分析句子的依存句法分析結果。
7.根據權利要求6所述的依存句法分析裝置,其特征在于,所述預處理模塊用于根據依存句法關系得到依存句法樹,判斷依存于根節點且為狀中關系的介詞,找到依存于所述介詞的最右節點,進行介詞短語邊界標記,抽取介詞短語句法分析訓練語料;判斷依存于根節點且為主謂關系或動賓關系的名詞是否存在依存于所述名詞且為定中關系或復合名詞修飾關系的詞,若存在則找到依存于該詞的最左及最右節點,進行名詞短語邊界標記,抽取名詞短語句法分析訓練語料;根據標記后的邊界抽取短語識別訓練語料。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京新一代人工智能研究院有限公司,未經南京新一代人工智能研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011123436.1/1.html,轉載請聲明來源鉆瓜專利網。





