[發明專利]一種關于英語閱讀理解測試疑問式簡答題的自動化命題方法有效
| 申請號: | 201410064433.3 | 申請日: | 2014-02-25 |
| 公開(公告)號: | CN103823794A | 公開(公告)日: | 2014-05-28 |
| 發明(設計)人: | 黃妍;何蓮珍 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06N5/00 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 關于 英語 閱讀 理解 測試 疑問 答題 自動化 命題 方法 | ||
1.一種關于英語閱讀理解測試疑問式簡答題的自動化命題方法,包括如下步驟:
(1)自然語言處理;
1.1利用自動句法標注器對文章中的句子進行句法分析,得到句子的短語結構和詞法信息;所述的詞法信息包括句子中各名詞的數以及各動詞的時態和體態;
1.2利用自動語義角色標注器提取所述句子中述語動詞指派給所在句中各句子成分的語義角色;所述的句子成分為單詞、短語或從句;
1.3利用自動指代消解器提取所述句子中代詞所指的句子成分;
1.4利用自動詞匯范疇標注器提取所述句子中實詞和固定短語的詞匯范疇;
1.5利用語料庫結合HAL法與LSA法,計算得到詞典范圍內所有單詞的語義向量;
(2)考點選取;
2.1計算文章中句子的詞頻密度;
2.2計算文章中每個段落應選的考點數目;
2.3取所述句子中所有單詞的語義向量的幾何中心作為句子的語義向量,進而計算文章中每個句子與其他句子的句義近似度;
2.4按詞頻密度從高到低的順序對文章中句子進行排序,依次判斷每個句子是否被選為考點;
(3)問句生成;
3.1對于被選為考點的句子,根據句子的詞法信息和各句子成分的語義角色建立句子基于詞匯功能語法理論的功能結構;
3.2使功能結構中的獨立功能體均作為提問對象;所述的獨立功能體是指功能結構中以子功能結構作為明細的屬性,其包括主語、賓語、間接賓語以及附加語;
3.3對于任一提問對象,確定該提問對象的中心語,進而根據中心語的詞匯范疇以及提問對象的語義角色確定提問對象的疑問詞;
3.4在被選為考點的句子中使該疑問詞代替提問對象,進而根據所述的短語結構和功能結構對該句子中的句子成分做主謂倒裝和時數一致性調整,生成以該疑問詞引導的特殊疑問句;
3.5根據步驟3.3~3.4遍歷每一個提問對象,生成多個特殊疑問句;
(4)同義改寫;
4.1對文章中的實詞或固定短語進行語義消歧,以確定實詞或固定短語在特殊疑問句中的語義;
4.2對于特殊疑問句中的任一實詞或固定短語,判斷該實詞或固定短語的語義是否為詞典中該實詞或固定短語的高頻義項,若是則進入步驟4.3,若否,則不對該實詞或固定短語做同義改寫;
4.3根據語義利用詞典獲取該實詞或固定短語的同義詞集合,依次對集合中的同義詞進行判斷:對于集合中的任一同義詞,判斷該實詞或固定短語的語義是否也是詞典中該同義詞的高頻義項,若是則進入步驟4.4,若否,則判斷集合中的下一個同義詞;
4.4判斷該同義詞是否超出閱讀理解測試所指定的詞匯范圍,若否,則將該同義詞替換該實詞或固定短語,若是,則判斷集合中的下一個同義詞;
4.5根據步驟4.2~4.4遍歷特殊疑問句中的所有實詞或固定短語;
4.6對于特殊疑問句中的任一代詞,判斷該代詞所指的句子成分是否也在該特殊疑問句中,若是,則不對該代詞做同義改寫,若否,則進一步判斷該特殊疑問句中是否存在另一個代詞所指的句子成分與該代詞的所指相同且該另一個代詞在特殊疑問句中處于該代詞前面的情況,若是,則不對該代詞做同義改寫,若否,則用該代詞所指的句子成分替換該代詞。
2.根據權利要求1所述的自動化命題方法,其特征在于:所述的步驟1.5中結合HAL法與LSA法得到詞典范圍內所有單詞的語義向量的具體過程為:首先,從語料庫中獲取單詞共現關系矩陣,該矩陣中任一元素的取值為該元素所在行和列分別對應的兩個單詞在語料庫中共同出現的次數;然后,對該共現關系矩陣進行奇異值分解,得到詞典范圍內所有單詞的語義向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410064433.3/1.html,轉載請聲明來源鉆瓜專利網。





