[發明專利]文本認知難度的度量方法無效
| 申請號: | 200910048309.7 | 申請日: | 2009-03-26 |
| 公開(公告)號: | CN101520773A | 公開(公告)日: | 2009-09-02 |
| 發明(設計)人: | 方寧;駱祥峰;徐煒民;劉方方 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 上海上大專利事務所(普通合伙) | 代理人: | 何文欣 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 認知 難度 度量 方法 | ||
技術領域:
木發明涉及一種文本的認知難度的度量方法,更具體地說,涉及一種計算文本中句子之間的邏輯關系來度量文本的認知難度的方法。
背景技術:
文本的認知過程離不開對文本句子之間邏輯關系的掌握。傳統的文本分析僅僅停留在語法分析和簡單的語義分析的基礎之上,很少有針對文本句子之間的邏輯關系的定量分析。本發明能從認知科學的角度對文本的認知難度進行度量,從而為基于機器的文本理解提供技術支持。
發明內容:
本發明的目的在于針對目前機器分析文本的局限性,提供一種文本認知難度的度量方法。其本質是把文本的理解過程抽象為一個概念學習的過程,通過對概念中的對象(句子)和屬性(關鍵詞)的邏輯運算來度量文本的認知難度。
為實現上述目的,本發明的構思是:把一篇文本中的關鍵詞,即具有重要意義的名詞和動詞,提取出來;統計每一個句子中出現和不出現的關鍵詞,形成一個布爾表達式;通過各種手段化簡這個布爾表達式到最簡單的形式,即包含的變量數目最少;再計算該文本的認知難度。
根據上述的發明構思,本發明采用下述技術方案:
一種文本認知難度的度量方法,其特征在于操作步驟如下:
(1)統計一篇文本中的關鍵詞和句子,所述關鍵詞就是該文本中具有重要含義的名詞和動詞;
(2)根據所述關鍵詞是否在相應的句子上出現來構建一個布爾表達式;
(3)根據所述布爾表達式進行邏輯運算來計算該文本的認知難度。
上述步驟(2)中的布爾表達式由若干項相加構成每一個所述項代表一個句子,每一項由若干變量相乘構成,每一個所述變量代表一個所述關鍵詞;若關鍵詞出現在相應的句子中,則所述變量為“1”;若關鍵詞不出現,則所述變量為“0”;把一個句子看成若干關鍵詞的相乘關系,再把一篇文本看成若干句子的相加關系,這樣,該文本就用一個布爾表達式來表示,為初始的布爾表達式。
上述步驟(3)中的所述的基于邏輯運算的文本認知難度的度量方法,其特征在于所述步驟(3)中所述的根據布爾表達式進行的邏輯運算就是對布爾表達式進行邏輯化簡,直到最簡單的布爾表達式出現為止。
上述最簡單的布爾表達式就是長度最短的布爾表達式,其包含的所述變量數目最少;所述最簡單的布爾表達式是由若干所述項相加構成。
上述文本的認知難度是用所述最簡單的布爾表達式所包含的所述變量數目除以所述初始的布爾表達式所包含的變量數目而得到的。
本發明與現有技術相比較,具有如下顯而易見的突出實質性特點和顯著優點:本發明先定義單篇文本為一個若各關鍵詞和句子組成的布爾表達式,再對該布爾表達式進行邏輯運算來度量該文本的認知難度,其核心是把文本的理解過程抽象為一個概念學習的認知過程。通過對概念中的對象(句子)和屬性(關鍵詞)的邏輯運算來度量文本的認知難度,本方法以計算文本中句子之間的邏輯關系,從而便于計算機進行處理。
具體實施方式:
本發明的一個優選實例如下:本文本認知難度的度量方法,操作步驟如下:
1.統計一篇文本中的關鍵詞和句子,關鍵詞就是該文本中具有重要含義的名詞和動詞;
2.根據關鍵詞是否在相應的句子上出現來構建一個布爾表達式。此布爾表達式由若干項相加構成,每一個項代表一個句子,每一項由若干變量相乘構成,每一個變量代表一個關鍵詞。若關鍵詞出現在相應的句子中,則變量為“1”;若關鍵詞不出現,則變量為“0”。把一個句子看成若干關鍵詞的相乘關系,再把一篇文本看成若干句子的相加關系,這樣該文本可以用一個布爾表達式來表示(初始的布爾表達式)。
假設有兩個關鍵詞分別用變量a和b表示。我們用項ab代表一個句子里出現了兩個關鍵詞a和b,用兩個項a+b代表第一個句子有關鍵詞a,第二個句子有關鍵詞b,用變量a’代表關鍵詞a沒有出現。
3.根據布爾表達式進行邏輯運算來計算該文本的認知難度,其特征在于操作步驟如下:
(1)對布爾表達式進行邏輯化簡,直到最簡單的布爾表達式出現為止。最簡單的布爾表達式就是布爾表達式的長度最短,即包含的變量數目最少。最簡單的布爾表達式是由若干項相加構成,每一項是由若干變量相乘構成;
(2)最簡單的布爾表達式所包含的變量數目除以初始的布爾表達式所包含的變量數目,從而得到該文本的認知難度度量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910048309.7/2.html,轉載請聲明來源鉆瓜專利網。





