[發明專利]一種運用計算機對開放式短對話進行交互式評分的方法有效

申請號：	201010591491.3	申請日：	2010-12-08
公開（公告）號：	CN102034475A	公開（公告）日：	2011-04-27
發明（設計）人：	王士進;梁家恩;徐波	申請（專利權）人：	中國科學院自動化研究所
主分類號：	G10L15/06	分類號：	G10L15/06;G10L15/08;G10L15/18
代理公司：	中科專利商標代理有限責任公司 11021	代理人：	梁愛榮
地址：	100190 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種運用計算機開放式對話進行交互式評分方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明屬于語音識別、語言評估、計算機輔助語言學習領域，提出了一種運用計算機對開放式短對話進行交互式評分的方法，具體涉及語音關鍵詞檢索技術、語音內容聚類技術、高精度音素識別技術。

背景技術

社會生活的信息化和經濟的全球化，使語言學習的重要性日益突出。語言作為最重要的信息載體之一，已成為人類生活各個領域中使用最廣泛的語言。

以英語為例，國內采用最多的口語學習形式是面對面的課堂教學，由于英語老師的缺乏，學生很難獲得一對一的英語學習環境。面對這種情況，多家單位開發了使用計算機進行英語口語發音診斷的系統，這些系統一般判斷指定的朗讀內容有沒有說，發音是否流利，發音是否正確，但是這些技能是比較初級的，很難滿足英語學習者越來越高的要求。

由于開放式題型比高度結構化的客觀題更能了解被測試人員的思維過程和語言能力，在語言學習和考核上具有很積極的意義。在開放式題型中，口語短對話是一個常見的題型，近年來，國內外計算機輔助語言學習領域針對開放式題型也做了一些嘗試，如美國教育考試服務中心(ETS)開發出對口語作文評分的系統SpeechRater，但這些系統存在的問題是由于專家知識覆蓋不全面而導致識別率很差，對于專家知識之外的內容則無法處理(或者效果很差)，針對更有難度的開放式口語短對話進行評分則無成熟的產品和技術解決方案。開放式口語短對話是一種常見的口語練習、口語考試的題型。

發明內容

鑒于國內外還沒有對開放式口語短對話進行評分的計算機系統，本發明的目的是提供一種采用人機交互的形式、在少量人工的輔助下，生成完備的專家知識，不受時間地點限制的運用計算機對開放式短對話進行交互式評分的方法。

為達成所述目的，本發明提供的一種運用計算機對開放式短對話進行交互式評分的方法，包括以下步驟：

步驟S1：收集并建立有被測試對象人群特點的語音數據庫；

步驟S2：在語音數據庫基礎上使用連續聲學模型訓練平臺，得到聲學模型；

步驟S3：對每個開放式短對話題型收集對應的文本形式的專家知識；

步驟S4：利用文本形式的專家知識生成用于內容檢測的評分特征模型；

步驟S5：提取答題樣本數據庫原始語音信號的語音特征；

步驟S6：將專家知識編譯成語法網絡，使用計算機語音關鍵詞檢索技術，裝載對應題型的評分特征模型并對答題樣本數據庫原始語音信號的語音特征進行內容檢測，分別得到答題樣本與專家知識匹配的內容及答題樣本與專家知識不匹配的內容；

步驟S7：使用語音內容聚類技術對檢測不到答題樣本與專家知識匹配的內容進行聚類，得到答題樣本分類，并通過音素識別技術對答題樣本分類中的語音做音素識別，得到每類答題樣本的音素內容；

步驟S8：人工對每類答題樣本的音素內容進行校驗修正，得到新的專家知識，并將新的專家知識充實到評分特征模型中；

步驟S9：綜合步驟S6檢測到答題樣本與專家知識匹配的答題樣本和步驟S8經過聚類、校驗修正的答題樣本，給出被測試對象所有語音的內容信息得分，并給出反饋意見。

其中，所述建立有被測試對象人群特點的語音數據庫使用策略如下：分性別尋找一批按照被測試對象年齡分布的人群，并根據設計好的音素平衡的錄音腳本對被測試對象年齡分布的人群進行語音錄制，得到被測試對象年齡分布的人群的語音特征。

其中，所述對檢測不到答題樣本與專家知識匹配的內容進行聚類的具體步驟如下：

步驟31：提取出語音數據庫中每個語音樣本的特征，并保存成特征文件；

步驟32：對特征文件進行兩兩之間距離的運算；

步驟33：根據兩兩特征文件之間的距離，對語音樣本進行聚類；

步驟34：對聚成的每個類，自動生成一個語音內容表示供人工校驗。

依據兩兩特征文件之間的距離，保證聚類內各個語音樣本距離都小于一個預定的閥值，預定的閥值通過實驗確定。

其中，所述檢測不到答題樣本與專家知識匹配的內容是專家事先無法估計的語法、詞匯用法形式，對每類答題樣本的內容信息使用音素識別器，用以避免超出專家知識的語音內容到對大詞匯連續語音識別的影響。

其中，為了加快人工校驗確認的速度，首先對每類中的語音樣本進行音素識別，然后對每類利用與該類內所有答題樣本識別出來的音素文本平均相似度最高的原則選擇一個音素文本作為該類的語音內容提交給人工校驗，由人工校驗判斷出該類的語音內容是否完全符合語法、應該如何補充到專家知識及如何對此類內容給出反饋的意見。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所，未經中國科學院自動化研究所許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201010591491.3/2.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】