[發(fā)明專利]生成口語(yǔ)考試參考答案的方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201310332699.7 | 申請(qǐng)日: | 2013-08-02 |
| 公開(公告)號(hào): | CN104347071B | 公開(公告)日: | 2020-02-07 |
| 發(fā)明(設(shè)計(jì))人: | 劉丹;魏思;陳進(jìn);胡郁;劉慶峰 | 申請(qǐng)(專利權(quán))人: | 科大訊飛股份有限公司 |
| 主分類號(hào): | G10L15/26 | 分類號(hào): | G10L15/26;G06F16/33;G06F16/35 |
| 代理公司: | 11252 北京維澳專利代理有限公司 | 代理人: | 王立民;吉海蓮 |
| 地址: | 230088 安徽省*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 生成 口語(yǔ) 考試 參考答案 方法 系統(tǒng) | ||
1.一種生成口語(yǔ)考試參考答案的方法,其特征在于,包括:
獲取考生答題語(yǔ)音數(shù)據(jù);
對(duì)所述考生答題語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別,獲得考生答題文本;
僅根據(jù)所述考生答題文本自動(dòng)生成參考答案樣本,包括:對(duì)所述考生答題文本聚類,基于聚類結(jié)果從中選擇可作為參考答案的所述考生答題文本作為參考答案樣本。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述僅根據(jù)所述考生答題文本生成參考答案樣本具體包括:
對(duì)所述考生答題文本聚類,得到所述考生答題文本的數(shù)據(jù)子類,每個(gè)數(shù)據(jù)子類包含至少一個(gè)考生答題文本;
確定所述數(shù)據(jù)子類中可以作為參考答案的有效子類;
選擇所述有效子類中的考生答題文本作為參考答案樣本。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)所述考生答題文本聚類,得到所述考生答題文本的數(shù)據(jù)子類包括:
將每個(gè)考生答題文本作為一個(gè)數(shù)據(jù)子類;
依次計(jì)算兩個(gè)數(shù)據(jù)子類間的距離,并合并具有最小距離的兩個(gè)數(shù)據(jù)子類得到新合并的數(shù)據(jù)子類,直到滿足預(yù)設(shè)的聚類結(jié)束條件;
將聚類結(jié)束后得到的數(shù)據(jù)子類作為所述考生答題文本數(shù)據(jù)的數(shù)據(jù)子類。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述計(jì)算兩個(gè)數(shù)據(jù)子類間的距離包括:
分別提取兩個(gè)數(shù)據(jù)子類的文本特征矢量;
計(jì)算兩個(gè)文本特征矢量的余弦距離,并將所述余弦距離作為所述兩個(gè)數(shù)據(jù)子類間的距離。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述提取數(shù)據(jù)子類的文本特征矢量包括:
提取所有考生答題文本中的主題詞;
計(jì)算所述主題詞的逆文檔概率;
根據(jù)所述逆文檔概率提取各數(shù)據(jù)子類的主題詞的相關(guān)特征,得到所述數(shù)據(jù)子類的文本特征矢量。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述確定所述數(shù)據(jù)子類中可以作為參考答案的有效子類包括:
計(jì)算每個(gè)考生答題語(yǔ)音數(shù)據(jù)的發(fā)音水平;
根據(jù)所述發(fā)音水平計(jì)算所述數(shù)據(jù)子類中答案正確的置信度;
如果所述置信度高于設(shè)定門限,則將所述數(shù)據(jù)子類作為參考答案的有效子類。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述確定所述數(shù)據(jù)子類中可以作為參考答案的有效子類包括:
選擇考生答題文本數(shù)據(jù)量超過(guò)設(shè)定閾值的數(shù)據(jù)子類作為參考答案的有效子類。
8.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述選擇所述有效子類中的考生答題文本作為參考答案樣本包括:
選擇所述有效子類中具有最高發(fā)音水平的考生答題文本作為參考答案樣本;和/或
選擇所述有效子類中具有最小樣本距離的考生答題文本作為參考答案樣本。
9.一種生成口語(yǔ)考試參考答案的系統(tǒng),其特征在于,包括:
獲取模塊,用于獲取考生答題語(yǔ)音數(shù)據(jù);
識(shí)別模塊,用于對(duì)所述考生答題語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別,獲得考生答題文本;
樣本生成模塊,用于僅根據(jù)所述考生答題文本自動(dòng)生成參考答案樣本,包括:對(duì)所述考生答題文本聚類,基于聚類結(jié)果從中選擇可作為參考答案的所述考生答題文本作為參考答案樣本。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述樣本生成模塊包括:
聚類單元,用于對(duì)所述考生答題文本聚類,得到所述考生答題文本的數(shù)據(jù)子類,每個(gè)數(shù)據(jù)子類包含至少一個(gè)考生答題文本;
子類確定單元,用于確定所述數(shù)據(jù)子類中可以作為參考答案的有效子類;
選擇單元,用于選擇所述有效子類中的考生答題文本作為參考答案樣本。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310332699.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 轉(zhuǎn)換文本的方法和設(shè)備
- 轉(zhuǎn)換文本的方法和設(shè)備
- 個(gè)性化外語(yǔ)口語(yǔ)學(xué)習(xí)系統(tǒng)及方法
- 終端及其口語(yǔ)學(xué)習(xí)方法
- 一種口語(yǔ)測(cè)評(píng)方法、裝置及一種生成口語(yǔ)測(cè)評(píng)模型的裝置
- 口語(yǔ)發(fā)音評(píng)測(cè)方法、裝置、設(shè)備及存儲(chǔ)設(shè)備
- 口語(yǔ)練習(xí)輔助方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本處理方法、裝置及計(jì)算設(shè)備
- 一種口語(yǔ)測(cè)評(píng)貼紙的獲取方法、終端設(shè)備及存儲(chǔ)介質(zhì)
- 口語(yǔ)信息處理方法、裝置和電子設(shè)備
- 生成口語(yǔ)考試參考答案的方法及系統(tǒng)
- 一種作業(yè)打分系統(tǒng)
- 一種智能的問(wèn)答系統(tǒng)
- 用于輔助應(yīng)答交互界面顯示方法及設(shè)備
- 數(shù)學(xué)主觀題解答結(jié)果批改方法及系統(tǒng)
- 一種口語(yǔ)評(píng)分方法及裝置
- 一種混合式SQL自動(dòng)評(píng)分方法
- 眾包任務(wù)的答案驗(yàn)證方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種評(píng)閱方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)裝置
- 一種英語(yǔ)聽寫批改方法、裝置和電子設(shè)備





