[發明專利]基于中心塊的句義成分關系分層識別方法無效
| 申請號: | 201310074970.1 | 申請日: | 2013-03-08 |
| 公開(公告)號: | CN103177089A | 公開(公告)日: | 2013-06-26 |
| 發明(設計)人: | 羅森林;魏超;潘麗敏;韓磊 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 中心 成分 關系 分層 識別 方法 | ||
1.漢語句義結構模型關系提取方法,先逐層提取句法結構樹中層次中心塊,進而獲取短語塊間的修飾關系并提取句子主干,其特征是:可分別完成句法結構樹中每層短語結構的中心塊識別;語義格識別;各句義成分間關系識別。?
2.根據權利要求1所述的漢語句義結構模型關系提取方法,其特征是中心塊定義。內容如下:?
中心塊定義:句法結構樹中,構成父節點的各子節點中處于被修飾地位的節點為中心塊,處于修飾地位的節點為非中心塊;若構成父親節點的幾個子節點不存在修飾與被修飾的關系,則各子節點均標為中心塊。包含主語、謂語、賓語、表語的短語節點也定義為中心塊。?
3.根據權利要求1所述的漢語句義結構模型關系提取方法,其特征是短語塊間修飾關系識別規則。內容如下:?
若句法結構樹的節點在句義結構中處于上下層的關系,則處于上層的是被修飾的,處于下層的充當修飾成分;若在句義結構中處于同一層,則相應的節點不存在修飾與被修飾的關系。?
4.根據權利要求1所述的漢語句義結構模型關系提取方法,其特征是識別中心塊模塊。內容如下:?
中心塊識別采用C4.5決策樹作為分類算法,包含兩個過程:?
訓練過程,基于中心塊定義進行模型訓練;?
識別過程,利用訓練模型指導新句子的中心塊識別。?
5.根據權利要求1所述的漢語句義結構模型關系提取方法,其特征是基本格識別規則。內容如下:?
基本格式別規則:若某個葉子節點為中心塊,此葉子節點必為基本格及謂詞。當判斷了一個葉子節點屬于基本格及謂詞后結合謂詞便可得到此葉子節點是否為基本格。謂詞是作為已知條件輸入。?
6.根據權利要求1所述的漢語句義結構模型關系提取方法,其特征是一般格識別規則。內容如下:?
一般格式別規則:經過統計,嘆詞(e)、語氣詞(y)、連詞(c)、助詞(u)、方位詞(f)、及介詞(p)的大都為非語義格。利用以上這些特征進行非語義格的識別,再通過排除篩選就可識別出一般格。?
7.根據權利要求1所述的漢語句義結構模型關系提取方法,其特征是謂詞間關系識別規則。內容如下:?
謂詞間關系識別規則:?
①謂詞“A”、謂詞“B”屬于同一個述題(Comment)下的兩個兄弟節點;?
②謂詞“A”、謂詞“B”屬于同一個述題(Comment)下并列關系的兩個句子的謂詞;?
③謂詞“A”所在的句子充當謂詞“B”所在句子話題(Topic)的基本格;?
④謂詞“A”所在的句子充當謂詞“B”所在句子述題(Comment)的基本格;?
⑤謂詞“A”、謂詞“B”所在的句子分別為構成復合句的兩分句。?
謂詞間關系的識別采用C4.5決策樹作為分類算法,包含兩個過程:?
訓練過程,基于謂詞間五類關系進行模型訓練?
識別過程,利用訓練模型指導新句子謂詞間關系識別。?
8.根據權利要求1所述的漢語句義結構模型關系提取方法,其特征是基本格與謂詞間關系識別規則。內容如下:?
基本格與謂詞間關系識別規則:?
根據話題與述題的相關定義,若基本格在句中處于謂詞之后,則此基本格為謂詞的相關述題。若基本格在句子中處于謂詞之前,一般將此基本格判為謂詞的相關話題;但是若此基本格所在的短語為介詞性短語,且介詞不為“和”、“與”、“跟”、“并”,則此基本格仍判為述題,因為此時的基本格充當把字句或是被子句的介詞賓語。?
9.根據權利要求1所述的漢語句義結構模型關系提取方法,其特征是一般格與各句義成分間關系識別規則。內容如下:?
一般格與各句義成分間關系識別規則:?
句法結構樹中,構成父節點的各子節點中處于被修飾地位的節點為中心塊,處于修飾地位的節點為非中心塊。用短語結構的中心塊節點替換其父親節點,原來的非中心塊則修飾現在的父親節點;原來中心塊節點的子節點則成為了原來非中心塊的兄弟節點;且原來的非中心塊依舊為其現在兄弟節點?的非中心塊,原來中心塊節點的子節點中的中心塊與非中心塊關系依舊不變。?
如上所述,用短語結構的中心塊節點替換其父親節點,經過多輪替換之后,直到完成句法結構樹中所有的中心塊替換,那么最終的結構樹中各下層節點均修飾其父親節點。最終得到的是一般格與各句義成分間關系的樹形表現形式。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310074970.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型的中導板與底盤的連接機構
- 下一篇:炒料型雙料倉瀝青路面綜合養護車





