[發明專利]一種漢語口頭作文計算機輔助評分方法有效
| 申請號: | 201410235530.4 | 申請日: | 2014-05-29 |
| 公開(公告)號: | CN103984834B | 公開(公告)日: | 2017-05-24 |
| 發明(設計)人: | 張益昕;張旭蘋;唐志強;王園園;李葆嘉 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F17/50 | 分類號: | G06F17/50;G06F17/30 |
| 代理公司: | 南京經緯專利商標代理有限公司32200 | 代理人: | 劉謙,朱小兵 |
| 地址: | 210093 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 漢語 口頭 作文 計算機輔助 評分 方法 | ||
1.一種漢語口頭作文計算機輔助評分方法,其特征在于,包括以下步驟:
通過錄音設備,收集各個考生口語作文作答音頻;
通過音頻轉碼軟件,對各個考生的作答音頻進行解碼,獲取學生的口頭作文文本信息;
對獲取的口頭作文文本信息進行人工修正,獲取較為精確的學生口頭作文文本信息;
對待評分口頭作文進行詞條總數分析,獲取歸一化的詞條統計參數;
對待評分口頭作文中斷比例參數的特征分析,獲取歸一化的中斷比例參數;
對待評分口頭作文均勻分布參數的特征分析,獲取歸一化的均勻分布參數;
對獲取的詞條統計參數、中斷比例參數、均勻分布參數,分別賦予相應權值并求和后獲得所述待評分口頭作文的最終評分結果;其中:
所述的歸一化詞條統計參數的計算公式如下:
其中:i是待評分口頭作文樣本的序號,Xi是第i號語料的作文詞條總數,Xmax是所有待評價語料樣本中詞條總數的最大值;其中,歸一化詞條統計參數的值在[0,1]之間;
所述的中斷比例參數的計算公式如下:
所述的歸一化中斷比例參數的計算公式如下:
其中:中斷比例i是第i號語料的中斷比例值,中斷比例min是所有待評價語料樣本中中斷比例的最小值;其中:歸一化后中斷比例參數的值在[0,1]之間,值越高者視為語流越流暢,語言質量越高;
所述的均勻分布參數的計算公式如下:
其中:S”定義為均勻分布參數;xi定義為第i組出現主題詞的個數,為每一個作文樣本在作文中主題詞分布的平均值;N定義為主題詞的組數;
所述的歸一化的均勻分布參數的計算公式如下:
其中:S”i為第i號語料的均勻分布參數值;S”min為所有待評價語料樣本中均勻分布參數的最小值;其中,歸一化均勻分布參數的值越高者視為主題越明確。
2.根據權利要求1所述的漢語口頭作文計算機輔助評分方法,其特征在于,所述的詞條總數的計算公式如下:
詞條總數=語料總數-標點、數字及字符的統計的統計總數。
3.根據權利要求1所述的漢語口頭作文計算機輔助評分方法,其特征在于,所述的中斷次數指具體統計詞頻表中選擇出的表示語流中斷的代表性的字、詞的次數。
4.根據權利要求1所述的漢語口頭作文計算機輔助評分方法,其特征在于,中斷統計中,語流中斷選擇代表性的字、詞,若選擇出的字、詞在文中表示承接關系,則不應視作語流的中斷,應從總的語言停頓統計中提出。
5.根據權利要求1所述的漢語口頭作文計算機輔助評分方法,其特征在于,所述的待評分口頭作文分數權重計算時依賴詞條統計參數、中斷比例參數和均勻分布參數,權重可通過經驗設定或通過自適應的反饋算法確定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410235530.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:PFC電路及逆變焊機電源
- 下一篇:涂板機卡片自動停機裝置





