[發明專利]一種運用計算機對開放式短對話進行交互式評分的方法有效
| 申請號: | 201010591491.3 | 申請日: | 2010-12-08 |
| 公開(公告)號: | CN102034475A | 公開(公告)日: | 2011-04-27 |
| 發明(設計)人: | 王士進;梁家恩;徐波 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/08;G10L15/18 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 梁愛榮 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 運用 計算機 開放式 對話 進行 交互式 評分 方法 | ||
1.一種運用計算機對開放式短對話進行交互式評分的方法,其特征在于:包含步驟如下:
步驟S1:收集并建立有被測試對象人群特點的語音數據庫;
步驟S2:在語音數據庫基礎上使用連續聲學模型訓練平臺,得到聲學模型;
步驟S3:對每個開放式短對話題型收集對應的文本形式的專家知識;
步驟S4:利用文本形式的專家知識生成用于內容檢測的評分特征模型;
步驟S5:提取答題樣本數據庫原始語音信號的語音特征;
步驟S6:將專家知識編譯成語法網絡,使用計算機語音關鍵詞檢索技術,裝載對應題型的評分特征模型并對答題樣本數據庫原始語音信號的語音特征進行內容檢測,分別得到答題樣本與專家知識匹配的內容及答題樣本與專家知識不匹配的內容;
步驟S7:使用語音內容聚類技術對檢測不到答題樣本與專家知識匹配的內容進行聚類,得到答題樣本分類,并通過音素識別技術對答題樣本分類中的語音做音素識別,得到每類答題樣本的音素內容;
步驟S8:人工對每類答題樣本的音素內容進行校驗修正,得到新的專家知識,并將新的專家知識充實到評分特征模型中;
步驟S9:綜合步驟S6檢測到答題樣本與專家知識匹配的答題樣本和步驟S8經過聚類、校驗修正的答題樣本,給出被測試對象所有語音的內容信息得分,并給出反饋意見。
2.根據權利要求1所述交互式評分的方法,其特征在于:建立有被測試對象人群特點的語音數據庫使用策略如下:分性別尋找一批按照被測試對象年齡分布的人群,并根據設計好的音素平衡的錄音腳本對被測試對象年齡分布的人群進行語音錄制,得到被測試對象年齡分布的人群的語音特征。
3.根據權利要求1所述交互式評分的方法,其特征在于:所述對檢測不到答題樣本與專家知識匹配的內容進行聚類的具體步驟如下:
步驟31:提取出語音數據庫中每個語音樣本的特征,并保存成特征文件;
步驟32:對特征文件進行兩兩之間距離的運算;
步驟33:根據兩兩特征文件之間的距離,對語音樣本進行聚類;
步驟34:對聚成的每個類,自動生成一個語音內容表示供人工校驗。
4.根據權利要求3所述交互式評分的方法,其特征在于:依據兩兩特征文件之間的距離,保證聚類內各個語音樣本距離都小于一個預定的閥值,預定的閥值通過實驗確定。
5.根據權利要求1所述交互式評的方法,其特征在于:所述檢測不到答題樣本與專家知識匹配的內容是專家事先無法估計的語法、詞匯用法形式,對每類答題樣本的內容信息使用音素識別器,用以避免超出專家知識的語音內容到對大詞匯連續語音識別的影響。
6.根據權利要求1所述交互式評分的方法,其特征在于:為了加快人工校驗確認的速度,首先對每類中的語音樣本進行音素識別,然后對每類利用與該類內所有答題樣本識別出來的音素文本平均相似度最高的原則選擇一個音素文本作為該類的語音內容提交給人工校驗,由人工校驗判斷出該類的語音內容是否完全符合語法、應該如何補充到專家知識及如何對此類內容給出反饋的意見。
7.根據權利要求1所述交互式評分的方法,其特征在于:所述給出反饋意見是給出詞匯使用、句型使用的反饋意見,達到以測試推動學習的目的。
8.一種利用權利要求1-7所述運用計算機對開放式短對話進行交互式評分的方法根據答題樣本數據庫的題型,可以用于大規模口語考試中的開放式短對話、開放式口語作文及各種開放式口語題型的內容評分;從語種上來說,可以運用于漢語、英語及各種語言的開放式題型內容評分,所述開放式口語作文包括看文本提示的口語作文、看圖口語作文及看視頻口語作文。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010591491.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:事故現場自動氣體采樣過程及其裝置
- 下一篇:電端子壓接方法及獲得的組件





