[發明專利]一種隱式篇章關系的分析方法及系統有效
| 申請號: | 201410379412.0 | 申請日: | 2014-08-04 |
| 公開(公告)號: | CN104090868A | 公開(公告)日: | 2014-10-08 |
| 發明(設計)人: | 洪宇;車婷婷;姚建民 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 215137 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 篇章 關系 分析 方法 系統 | ||
技術領域
本申請涉及自然語言處理技術領域,更具體地說,涉及一種隱式篇章關系的分析方法及系統。
背景技術
在篇章研究領域,篇章是論元經過語義關聯和結構化組織形成的自然語言文體。篇章關系是同一篇章內部,相鄰論元或跨度在一定范圍內的論元間的語義關聯性質,如對比關系、擴展關系等。其中,論元是篇章中具有獨立語義的文字片段,是形成篇章關系的基本表現單元。篇章關系分析是解釋論元間的語義關系。
根據論元間是否存在顯式連接詞(如“所以”等),篇章關系可以劃分為顯式關系和隱式關系兩類。顯式關系因具有連接詞等指向特定篇章關系的直觀線索而易于檢測。但是,隱式篇章關系由于缺乏連接詞,其檢測難度非常大,目前還沒有一種有效的方案,能夠針對隱式篇章關系進行分析。
發明內容
有鑒于此,本申請提供了一種隱式篇章關系的分析方法及系統,用于解決現有技術缺乏對隱式篇章關系進行分析的有效方案。
為了實現上述目的,現提出的方案如下:
一種隱式篇章關系的分析方法,包括:
接收用戶輸入的包括前置論元和后置論元的待測隱式論元實例;
在語料庫中篩選與所述待測隱式論元實例具有語義平行性且包含預設連接線索詞的顯式論元實例;
計算每個所述顯式論元實例與所述待測隱式論元實例的語義平行度;
按照第一預設規則,篩選出若干個所述顯式論元實例并確定為平行顯式論元實例集合;
計算每一個平行顯式論元實例的篇章關系的置信度;
至少利用每一個平行顯式論元實例的語義平行度、篇章關系置信度及第二預設規則,計算平行顯式論元實例集合中每一類篇章關系與待測隱式論元實例的篇章關系的平行概率;
將平行概率最大的一類篇章關系確定為所述待測隱式論元實例的篇章關系。
優選地,所述在語料庫中篩選出與所述待測隱式論元實例具有語義平行性且包含預設連接線索詞的顯式論元實例為:
分別抽取所述待測隱式論元實例的前置論元、后置論元的二元文法,得到若干個前置文法和若干個后置文法;
將每一個所述前置文法分別與各個所述后置文法進行組合,并將每一個組合確定為一個查詢條件;
利用每一個所述查詢條件在所述語料庫中查找包含預設連接線索詞的顯式論元實例。
優選地,所述計算每個所述顯式論元實例與所述待測隱式論元實例的語義平行度為:
利用Jaccard算法,計算每個所述顯式論元實例的前置論元與所述待測隱式論元實例的前置論元的平行度,確定為第一平行度;
利用Jaccard算法,計算每個所述顯式論元實例的后置論元與所述待測隱式論元實例的后置論元的平行度,確定為第二平行度;
求取所述第一平行度與所述第二平行度的平均值,并確定為所述待測隱式論元實例的語義平行度。
優選地,所述第一預設規則為:
選取順序排列的若干個顯式論元實例中預設比例的前n個顯式論元實例,確定為平行顯式論元實例集合;或者,
選取滿足預設語義平行度參考值的顯式論元實例,確定為平行顯式論元實例集合。
優選地,所述計算每一個平行顯式論元實例的篇章關系的置信度為:
Gj=|gj-gnorm(j)|
其中,j代表篇章關系,gj表示篇章關系j在平行顯式論元實例集合中的概率分布,gnorm(j)表示篇章關系J在所述語料庫中的概率分布,Gj表示篇章關系J的分布概率差異,j∈sences,sences為篇章關系集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410379412.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用戶行為數據的分析方法和裝置
- 下一篇:一種固態存儲設備的地址分配方法





