[發明專利]一種自然語言句子的語義關系樹的構造和比較方法無效
| 申請號: | 200810243607.7 | 申請日: | 2008-12-10 |
| 公開(公告)號: | CN101446944A | 公開(公告)日: | 2009-06-03 |
| 發明(設計)人: | 周國棟;錢培德;朱巧明;李培峰;李軍輝;孔芳;王紅玲;錢龍華 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 蘇州創元專利商標事務所有限公司 | 代理人: | 陶海鋒 |
| 地址: | 215123江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自然語言 句子 語義 關系 構造 比較 方法 | ||
1.一種自然語言句子的語義關系樹的構造方法,其特征在于,對于句子中待建立語義關系樹的兩個實體,采用下列構造方法:
(1)采用語法分析器產生與句子相對應的句法樹;
(2)在句法樹中確定兩個實體的位置,方法是,依據兩個實體的外延范圍在句法樹中從詞匯結點向上尋找,直到發現一個共同結點,即把它確定為實體在句法樹中的位置;
(3)在句法樹中找出連接兩實體的最短路徑,分別從兩個實體結點出發,向上搜索,并記錄經過的路徑,直到發現一個最近的共同祖先結點,此時搜索過程中記錄下的連接兩實體的路徑即為最短路徑;
(4)在語義關系樹中,保留最短路徑及其所包含的部分,裁剪掉其余部分,最后得到的最小的語義關系樹即為最短路徑包含樹;
(5)確定句法樹中兩實體之間存在的結構類別,如果兩個實體之間用一個逗號分隔,則為半結構化;如果第二個實體是以介詞短語形式修飾第一個實體,則為PP附屬結構;如果第二個實體的外延包含了第一個實體,則為嵌入式結構;如果兩個實體作為名詞短語緊接在一起,則為描述性結構;除此之外的所有結構均視作謂詞鏈接結構;
(6)如果兩實體之間的結構類型不是謂詞結構,則最短路徑包含樹即為我們所需要的語義關系樹;
如果兩實體之間的結構類型是謂詞鏈接結構,則擴展與謂詞相關的上下文信息,得到上下文相關的路徑包含樹,其方法是,首先從最短路徑包含樹的根節點開始向上移動直到找到一個以謂詞為中心詞的節點,然后沿著以該謂詞為中心詞的路徑找到該謂詞,這樣被最短路徑包含樹和該謂詞查找路徑所涵蓋的子樹即我們要找的動態語義關系樹。
2.一種自然語言句子的語義關系樹的比較方法,其特征在于:對采用權利要求1所述方法獲得的兩棵語義關系樹T1和T2,采用下列方法進行比較:
(1)列出樹T1和T2中除葉結點以外的所有結點列表L1和L2;
(2)對于結點列表之間的任意兩個結點n1和n2,再連同它們的父結點和祖父結點包括在內,用第(3)、(4)步的方法進行比較,然后將所有的比較結果累加起來,得到最后的結果;
(3)如果以n1和n2為根節點的上下文無關產生式不具有相似性,則返回結果0;否則轉下步,所述兩個產生式的相似性,是指它們有相同或可替換的頭節點;
(4)如果n1和n2是詞性標記,則返回結果λ,λ的取值為0~1;否則轉下步。
(5)分別找出n1和n2的子結點列表,如果列表不完全一致,則轉第6步,否則按照順序兩兩配對比較,比較方法同第(3)、(4)步,最后把結果相乘并返回;
(6)找出n1和n2的子結點列表進行模糊匹配時插入刪除的可選樹節點數#InsDels,和相似樹節點的替換樹節點數#Subs,然后按照順序對相似樹節點兩兩配對比較,比較方法同第(3)、(4)步,最后把結果相乘,然后再乘以λ1#InsDelsλ2#Subs,λ1和λ2分別為0.6和0.4,最后結果再返回;
步驟(2)中獲得的最后結果值即為兩棵語義關系樹的相似度。
3.根據權利要求2所述自然語言句子的語義關系樹的比較方法,其特征在于:λ的取值為0.4。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810243607.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種障礙物分割方法及裝置
- 下一篇:存儲設備操作的方法、控制器及通信系統





