[發明專利]一種論元抽取方法和系統有效
| 申請號: | 201310482550.7 | 申請日: | 2013-10-15 |
| 公開(公告)號: | CN103530281A | 公開(公告)日: | 2014-01-22 |
| 發明(設計)人: | 李培峰;朱巧明;周國棟;張玉華;孔芳 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 215123 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 抽取 方法 系統 | ||
1.一種論元抽取方法,其特征在于,包括:
從訓練語料中抽取包含標注信息的標注事件實例,基于所述標注信息對所述標注事件實例進行分析、處理,得到訓練語料論元模式集合,其中,所述訓練語料論元模式集合包括至少一個訓練語料論元模式,所述訓練語料論元模式包括由所述標注事件實例的論元、所述標注事件實例的觸發詞、所述論元到所述觸發詞的依存路徑組合成的三元組;
從測試語料中抽取事件實例,獲取所述事件實例的角色集合,基于所述角色集合對所述事件實例進行分析、處理,得到測試語料候選論元模式集合,其中,所述測試語料候選論元模式集合包括至少一個候選論元模式,所述候選論元模式包括由所述事件實例的候選論元、所述事件實例的觸發詞、所述候選論元到所述觸發詞的依存路徑組合成的三元組;
根據論元語義相似性、觸發詞語義相似性以及依存路徑相似性,計算所述測試語料候選論元模式中的每一候選論元模式和所述訓練語料論元模式集合中的各論元模式的模式語義相似度,得到每一候選論元模式的模式語義相似度集合;
基于各個候選論元模式的模式語義相似度集合,獲取論元模式相似度集合,所述論元模式相似度集合包括論元模式相似度元素,所述論元模式相似度元素包括候選論元模式中的候選論元匹配所述事件實例中可匹配角色的匹配度信息;
基于所述論元模式相似度集合,選取與所述事件實例中的角色匹配度最高且匹配度大于預設閾值的候選論元作為所述角色的論元。
2.根據權利要求1所述的論元抽取方法,其特征在于,所述基于所述角色集合對所述事件實例進行分析、處理,得到測試語料候選論元模式集合具體包括:
對所述事件實例進行實體識別和依存關系分析,得到測試語料實體集合和測試語料依存關系集合;
依據所述角色集合對所述測試語料實體集合中的實體進行分析、處理,得到測試語料候選論元集合;
根據所述測試語料依存關系集合,獲取所述測試語料候選論元集合中的每一候選論元到其對應的觸發詞實例的依存路徑;
將所述候選論元、所述候選論元對應的觸發詞實例和依存路徑進行組合,得到測試語料候選論元模式,各測試語料候選論元模式構成測試語料候選論元模式集合;
依據預設的篩選規則從所述測試語料候選論元模式中刪除不符合所述預設的篩選規則的候選論元模式,得到測試語料篩選論元模式,將所述測試語料篩選論元模式替換所述測試語料候選論元模式作為新的測試語料候選論元模式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310482550.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:獲取好友名單的方法和裝置
- 下一篇:可自動折疊的LED顯示屏及其使用方法





