[發(fā)明專利]一種英語作文語篇連貫質(zhì)量的分析方法有效
| 申請?zhí)枺?/td> | 201611109331.4 | 申請日: | 2016-12-06 |
| 公開(公告)號: | CN106776550B | 公開(公告)日: | 2019-12-13 |
| 發(fā)明(設(shè)計)人: | 黃桂敏;馮其良;黃思睿 | 申請(專利權(quán))人: | 桂林電子科技大學(xué) |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 45112 桂林市華杰專利商標(biāo)事務(wù)所有限責(zé)任公司 | 代理人: | 羅玉榮 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 英語 作文 連貫 質(zhì)量 分析 方法 | ||
本發(fā)明提供一種英語作文語篇連貫質(zhì)量的分析方法,該方法是一個由順序連接的英語作文預(yù)處理模塊、英語作文語法角色標(biāo)注模塊、英語作文特征提取模塊、英語作文共指消解模塊、英語作文實體鏈網(wǎng)格構(gòu)建模塊和英語作文語篇連貫分析模塊組成的分析模型。一篇英語作文通過該分析模型處理后,最后能夠得到這篇英語作文的語篇連貫質(zhì)量分析結(jié)果。本發(fā)明的方法解決了英語作文中指代關(guān)系、語言用詞的連貫性分析問題,其分析結(jié)果比傳統(tǒng)的英語作文語篇連貫質(zhì)量分析方法的分析結(jié)果更好。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)、機器學(xué)習(xí)算法、英語作文內(nèi)容分析技術(shù),具體是一種英語作文語篇連貫質(zhì)量的分析方法。
背景技術(shù)
傳統(tǒng)的英語文本語篇連貫質(zhì)量分析方法主要有潛在語義分析方法和實體網(wǎng)格分析方法。潛在語義分析方法是一種通過構(gòu)建詞-文檔矩陣,利用奇異值分解對詞-文檔矩陣進行降維,分析詞匯之間內(nèi)在語義聯(lián)系的方法。然而,因為奇異值分解是一種數(shù)學(xué)變換,新生成的矩陣解釋性比較差,而且潛在語義分析方法還存在無法處理一詞多義現(xiàn)象,忽略詞出現(xiàn)的先后順序的缺點。近年來實體網(wǎng)格分析方法逐步在代替潛在語義分析方法,成為一種更為廣泛使用的英語文本語篇連貫質(zhì)量分析方法。而且,傳統(tǒng)的英語文本語篇連貫質(zhì)量分析方法普遍都是解決新聞報道內(nèi)英語文本中出現(xiàn)的語篇連貫性問題,由于這類英語文本的篇章結(jié)構(gòu)、指代關(guān)系、語言用詞都比較固定,傳統(tǒng)的英語文本語篇連貫質(zhì)量分析方法能夠取得較好的分析結(jié)果;然而,由于英語作文的篇章結(jié)構(gòu)、指代關(guān)系、語言用詞都不固定,所以傳統(tǒng)的英語文本語篇連貫質(zhì)量分析方法在分析英語作文的語篇連貫質(zhì)量方面取得的分析結(jié)果不太理想。因此針對上述問題,本發(fā)明專利提供了一種英語作文語篇連貫質(zhì)量的分析方法。
發(fā)明內(nèi)容
1.一種英語作文語篇連貫質(zhì)量的分析方法,其特征是:包括一個由順序連的英語作文預(yù)處理模塊、英語作文語法角色標(biāo)注模塊、英語作文特征提取模塊、英語作文共指消解模塊、英語作文實體鏈網(wǎng)格構(gòu)建模塊和英語作文語篇連貫分析模塊組成的分析模型,該分析模型總體處理步驟如圖1所示。
在分析模型中,第一步英語作文預(yù)處理模塊讀入一篇英語作文,對該篇英語作文進行分段、分詞、分句、詞性標(biāo)注和依存句法分析,輸出該英語作文的預(yù)處理結(jié)果;第二步英語作文語法角色標(biāo)注模塊讀入該英語作文的預(yù)處理結(jié)果,在預(yù)處理結(jié)果中找出每個實體詞的依存關(guān)系,并根據(jù)依存關(guān)系標(biāo)注這些實體詞在其句子中的語法角色,輸出這些實體詞在其句子中的語法角色;第三步英語作文特征提取模塊讀入該英語作文的預(yù)處理結(jié)果,對預(yù)處理結(jié)果中實體詞進行語義等級定義,同時提取這些實體詞的共指消解特征,輸出這些實體詞共指消解特征;第四步英語作文特征提取模塊讀入英語作文特征提取模塊輸出的實體詞共指消解特征,通過共指消解模型和實體詞共指消解特征,對實體詞的共指關(guān)系進行分析,輸出這些實體詞構(gòu)成的共指鏈表;第五步英語作文實體鏈網(wǎng)格構(gòu)建模塊讀入英語作文共指消解模塊輸出的實體詞共指鏈表,利用實體詞共指鏈表構(gòu)建該英語作文實體鏈網(wǎng)格,并用優(yōu)先級高語法角色替換實體鏈網(wǎng)格中優(yōu)先級低語法角色,輸出該英語作文的實體鏈網(wǎng)格;第六步英語作文語篇連貫分析模塊讀入英語作文實體鏈網(wǎng)格構(gòu)建模塊輸出的英語作文實體鏈網(wǎng)格,通過這個實體鏈網(wǎng)格分析英語作文的句子連貫度,并計算英語作文的語篇連貫質(zhì)量,輸出該英語作文的語篇連貫質(zhì)量分析結(jié)果;下面是該分析模型中每個模塊的處理步驟:
(1)所述的英語作文預(yù)處理模塊處理步驟如下,如圖2所示:
P201開始;
P202讀入英語作文;
P203對英語作文進行分段;
P204對英語作文進行分句;
P205對英語作文進行分詞;
P206根據(jù)單詞詞性標(biāo)注集對英語作文進行詞性標(biāo)注;
P207根據(jù)英語作文的詞性標(biāo)注結(jié)果,生成英語作文的單詞有向圖。在該有向圖中,一個節(jié)點為單詞及其詞性標(biāo)注,每個節(jié)點之間通過一條有向邊連接起來;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于桂林電子科技大學(xué),未經(jīng)桂林電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611109331.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





