[發明專利]基于受限的語義依存分析的文本推理方法有效
| 申請號: | 201110336338.0 | 申請日: | 2011-10-31 |
| 公開(公告)號: | CN102360346A | 公開(公告)日: | 2012-02-22 |
| 發明(設計)人: | 姬東鴻;呂晨;滕沖;張明堯;孫程;陳波;汪輝;史華新;韓欣;吳龍飛 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 張火春 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 受限 語義 依存 分析 文本 推理 方法 | ||
1.一種基于受限的語義依存分析的文本推理方法,其特征在于,包括以下步驟:
步驟一、根據語義依存的表示機制,建立一個漢語文本推理標注資源,其中,一個文本推理標注實例包含一個語段T、一個假設H、假設H的語義依存圖及推理類型;
步驟二、在步驟一所建立的漢語文本推理標注資源的基礎上,在新輸入的語段T的限制下對新輸入的假設H進行語義依存分析,從而判斷語段T是否能推理出假設H;
步驟三、對步驟二的分析過程和判斷結果進行評估、分析和概括,并利用反饋改善分析過程的性能。
2.根據權力要求1所述的基于受限的語義依存分析的文本推理方法,其特征在于:
所述的步驟二具體為:以步驟一所建立的漢語文本推理標注資源為基礎,在新輸入的語段T的限制下對新輸入的假設H進行語義依存分析,得到假設H的語義依存圖,如果假設H的語義依存圖存在的概率大于預設值δ,則語段T可推理出假設H,否則無法推理出假設H,其中,δ根據實驗結果設定。
3.根據權力要求2所述的基于受限的語義依存分析的文本推理方法,其特征在于:
所述的假設H的語義依存圖的獲得,包括以下步驟:
1)無向樹分析,該步驟進一步包括以下子步驟:
1.1將無向樹分析形式化為????????????????????????????????????????????????,其中,表示假設H的最大生成樹,STh為假設H的生成樹集合,θ為特征的權重向量,t為假設H的生成樹集合中的元素,為描寫t的特征向量;?
所述的特征有如下幾種:
a、二元特征:對于任一條邊,二元特征包括:、、、,其中,和分別指和在Hownet或同義詞詞林中所屬的概念類;
b、結構特征:與鄰接的任一節點,?則為一結構特征;
c、上下文特征:位于假設H中和間任一位置或和外一定距離的詞,則為一上下文特征;
d、語段T上下文特征:假設H中實詞在語段T中一般有對應,因此語段T上下文特征可通過上述的上下文特征方法獲得;如果語段T上下文特征中有指代,則采用其指代候選參與構成特征;?
e、語段T結構特征:對語段T進行結構分析,并利用語段T中包含的依存關系,得到語段T結構特征;如果語段T結構特征中有指代,則采用其指代候選參與構成特征;?
f、歷史特征:是根據分析過程中自定義的啟發式規則特征、用來模擬由無標記無向圖到有標記有向圖的轉換過程;?
1.2?把訓練數據中的每個標記轉化為節點,并確定最大生成樹;
1.3對步驟1.2所得的樹進行訓練;
1.4?根據步驟1.3的訓練輸出,采用步驟1.1中的公式對新輸入的語段T和新輸入的假設H進行解碼,即得到假設H對應的無標記的無向樹;
????2)有向圖分析,該步驟進一步包括以下子步驟:
2.1無向圖分析:將步驟1)所得的無標記的無向樹轉換為無標記的無向圖;
2.2?標記分析:將步驟2.1?所得的無標記的無向圖轉換為有標記的無向圖;
2.3有向圖分析:將步驟2.2?所得的有標記的無向圖轉換為有標記的有向圖,即得到假設H的語義依存圖。
4.根據權力要求3所述的基于受限的語義依存分析的文本推理方法,其特征在于:
所述的步驟1.2中最大生成樹的確定是采用普里姆算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110336338.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:防火車脫軌的裝置
- 下一篇:一種納米氧化鐵改性石英砂濾材及其制備方法





