[發明專利]一種英語文本的語義結構連貫分析方法有效
| 申請號: | 201910596522.5 | 申請日: | 2019-07-03 |
| 公開(公告)號: | CN110287497B | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 黃桂敏;譚敏;周婭 | 申請(專利權)人: | 桂林電子科技大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06F40/216;G06F40/289;G06F40/253;G06F16/36 |
| 代理公司: | 桂林市華杰專利商標事務所有限責任公司 45112 | 代理人: | 楊雪梅 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 英語 文本 語義 結構 連貫 分析 方法 | ||
本發明公開一種英語文本的語義結構連貫分析方法,該分析方法是一個由順序連接的英語文本預處理模塊、英語文本語義結構關系樹生成模塊、英語文本語義結構關系抽取模塊、英語文本語義結構關系矩陣構建模塊與英語文本語義結構連貫質量分析模塊組成。一篇英語文本通過該分析方法處理后,最后能夠得到該篇英語文本的語義結構質量分析結果。本發明方法解決了傳統的英語文本語義結構連貫質量分析方法,只能分析出英語文本的淺層局部語義結構連貫質量,無法分析出英語文本深層語義結構連貫質量的問題。
技術領域
本發明涉及自然語言處理技術,具體是一種針對英語文本的語義結構連貫分析方法,本發明的分析方法只適用于分析英語文本,不適用于分析中文文本。
背景技術
全世界使用英語的人口達到17億,采用英語作為官方語言的國家有67個,全世界半數以上的出版物都用英語出版,互聯網上的網頁或信息80%以上使用英文,同時英語文本(如新聞、評論、郵件等)充斥人們的生活與工作的各個方面。
英語文本的語篇連貫是指英語文本中的句子并列、承接、遞進、轉折等關系,是否在表達上前后銜接、指代一致、話題相關、主位與述位合理。英語文本的語義結構連貫是指英語文本中句子單詞序列、段落與句子之間,以及單個句子內部是否合乎給定的語法規則與句法結構。可見,英語文本的語篇連貫與英語文本的語義結構連貫是英語文本中兩種不同連貫指標。因此,分析英語文本的語義結構連貫質量,是評價英語文本寫作質量的重要指標。然而,傳統的英語文本語義結構連貫質量分析方法,只能分析出英語文本的淺層局部語義結構連貫質量,無法分析出英語文本深層語義結構連貫質量。
發明內容
本發明的目的是針對傳統英語文本語義結構連貫質量分析方法的不足,而提供一種英語文本的語義結構連貫分析新方法,從英語文本語義結構關系出發,通過挖掘英語文本中的全局語義結構關系信息,實現了對英語文本深層語義結構連貫質量的分析。
實現本發明目的的技術方案是:
一種英語文本的語義結構連貫分析方法,包括一個由順序連接的英語文本預處理模塊、英語文本語義結構關系樹生成模塊、英語文本語義結構關系抽取模塊、英語文本語義結構關系矩陣構建模塊與英語文本語義結構連貫質量分析模塊,如圖1所示;
其分析方法包括如下處理步驟:
(1)英語文本預處理模塊,讀入英語文本,對英語文本進行分段、分句、分詞、詞性標注、句法結構處理,提取生成英語文本的實體詞集合;
(2)英語文本語義結構關系樹生成模塊,讀入英語文本,首先采用段落級語義結構關系解析器,對英語文本進行段落級別的語義結構關系解析,生成英語文本的粗語義結構關系樹;然后采用句子級語義結構關系解析器,對粗語義結構關系樹的葉子節點,進行句子內部的語義結構關系解析,生成英語文本的語義結構關系樹;
(3)英語文本語義結構關系抽取模塊,遍歷生成的英語文本的語義結構關系樹,并提取生成英語文本中每個小句包含的英語文本的語義結構關系信息集合;
(4)英語文本語義結構關系矩陣構建模塊,首先讀入提取生成的英語文本實體詞集合、英語文本語義結構關系信息集合;然后采用遍歷匹配方法把各小句之間的語義結構關系集賦予小句的實體詞中,并記錄實體詞所在位置信息;最后利用句中實體詞的語義結構關系信息所表示的該句包含的語義結構關系信息,構建出英語文本的語義結構關系矩陣;
(5)英語文本語義結構連貫質量分析模塊,首先讀入英語文本的語義結構關系矩陣;然后對英語文本的語義結構關系子序列與轉移語義結構關系子序列的分布特征進行分析;最后根據得到的分布特征,來分析英語文本的語義結構連貫質量,并輸出英語文本的語義結構連貫質量分數與評語。
本發明英語文本的語義結構連貫分析方法涉及的概念與定義如下
(1)單詞詞性標注集
本發明的英語文本單詞詞性標注采用賓州樹庫標注集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林電子科技大學,未經桂林電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910596522.5/2.html,轉載請聲明來源鉆瓜專利網。





