[發(fā)明專利]語音輸入糾錯(cuò)方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210101294.8 | 申請日: | 2012-03-31 |
| 公開(公告)號: | CN103366741B | 公開(公告)日: | 2019-05-17 |
| 發(fā)明(設(shè)計(jì))人: | 蔡洪濱;李曜;陳良軍;何昕 | 申請(專利權(quán))人: | 上海果殼電子有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G06F3/16 |
| 代理公司: | 上海百一領(lǐng)御專利代理事務(wù)所(普通合伙) 31243 | 代理人: | 馬育麟 |
| 地址: | 201203 上海市張江*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 輸入 糾錯(cuò) 方法 系統(tǒng) | ||
本發(fā)明涉及一種語音輸入糾錯(cuò)方法及系統(tǒng),所述方法包括:將輸入的語音轉(zhuǎn)化成識別文本和識別網(wǎng)絡(luò);根據(jù)所述識別網(wǎng)絡(luò)生成詞匯網(wǎng)絡(luò);獲取所述識別文本中待修正內(nèi)容;以及獲取修改備選項(xiàng)替換或重錄指令,若為修改備選項(xiàng)替換指令,則根據(jù)所述詞匯網(wǎng)絡(luò)生成對應(yīng)于所述待修正內(nèi)容的修改備選項(xiàng),并從所述修改備選項(xiàng)中選擇正確內(nèi)容替換所述待修正內(nèi)容;若為重錄指令,則重新獲取對應(yīng)于所述待修正內(nèi)容的語音并修正所述待修正內(nèi)容,本發(fā)明不僅可以提供修改備選項(xiàng)以修改所述識別文本中的出錯(cuò)部分,也可通過重錄部分語音來修改所述識別文本中的出錯(cuò)部分。
技術(shù)領(lǐng)域
本發(fā)明屬于語音識別領(lǐng)域,特別涉及一種語音輸入糾錯(cuò)方法及系統(tǒng)。
背景技術(shù)
語音輸入是通過語音識別將人說話的內(nèi)容轉(zhuǎn)換為文本的一種輸入方式。由于在實(shí)際應(yīng)用中,語音識別面對的環(huán)境十分復(fù)雜,需要處理各種不同領(lǐng)域的說話內(nèi)容,識別性能很難達(dá)到百分之百,所以對于文本準(zhǔn)確性要求較高的應(yīng)用而言,識別結(jié)果文本的修改顯得格外重要,目前常見的語音輸入糾錯(cuò)方法包括:用戶自行編輯文本;用戶通過移動光標(biāo)選擇有錯(cuò)誤的文本以獲得候選;用戶通過整句重說的方式進(jìn)行糾錯(cuò)等,這些方法通常會使用戶感到明顯的不流暢感。
因此,目前亟需一種方便流暢的修改方法以提高輸入效率,從而提升用戶體驗(yàn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種語音輸入糾錯(cuò)方法及系統(tǒng),不僅可以提供修改備選項(xiàng)以修改所述識別文本中的出錯(cuò)部分,也可通過重錄部分語音來修改所述識別文本中的出錯(cuò)部分。
為解決上述問題,本發(fā)明提供一種語音輸入糾錯(cuò)方法,包括:
將輸入的語音轉(zhuǎn)化成識別文本和識別網(wǎng)絡(luò);
根據(jù)所述識別網(wǎng)絡(luò)生成詞匯網(wǎng)絡(luò);
獲取所述識別文本中待修正內(nèi)容;以及
獲取修改備選項(xiàng)替換或重錄指令,若為修改備選項(xiàng)替換指令,則根據(jù)所述詞匯網(wǎng)絡(luò)生成對應(yīng)于所述待修正內(nèi)容的修改備選項(xiàng),并從所述修改備選項(xiàng)中選擇正確內(nèi)容替換所述待修正內(nèi)容;若為重錄指令,則重新獲取對應(yīng)于所述待修正內(nèi)容的語音并修正所述待修正內(nèi)容。
進(jìn)一步的,在上述方法中,通過觸摸控制操作獲取所述識別文本中待修正內(nèi)容、獲取修改備選項(xiàng)替換或重錄指令、從所述修改備選項(xiàng)中選擇正確內(nèi)容替換所述待修正內(nèi)容以及重新獲取對應(yīng)于所述待修正內(nèi)容的語音并修正所述待修正內(nèi)容。
進(jìn)一步的,在上述方法中,通過預(yù)設(shè)的自適應(yīng)聲學(xué)模型和自然語言模型將輸入的語音轉(zhuǎn)化成識別文本和識別網(wǎng)絡(luò)。
進(jìn)一步的,在上述方法中,所述重新獲取對應(yīng)于所述待修正內(nèi)容的語音并修正所述待修正內(nèi)容的步驟包括:重新獲取對應(yīng)于所述待修正內(nèi)容的語音并將所述重新獲取的語音轉(zhuǎn)化為新的識別文本和新的識別網(wǎng)絡(luò),根據(jù)所述新的識別文本或新的識別網(wǎng)絡(luò)修正所述待修正內(nèi)容。
進(jìn)一步的,在上述方法中,根據(jù)所述待修正內(nèi)容在所述識別文本中的上下文信息將所述重新獲取的語音轉(zhuǎn)化為新的識別文本和新的識別網(wǎng)絡(luò)。
進(jìn)一步的,在上述方法中,所述根據(jù)所述新的識別文本和新的識別網(wǎng)絡(luò)修正所述待修正內(nèi)容的步驟包括:
判斷所述新的識別文本是否正確;
若正確,則將所述新的識別文本替換所述待修正內(nèi)容;
若不正確,根據(jù)所述新的識別網(wǎng)絡(luò)生成新的詞匯網(wǎng)絡(luò),并獲取修改備選項(xiàng)替換或重錄指令,若為修改備選項(xiàng)替換指令,則根據(jù)所述新的詞匯網(wǎng)絡(luò)生成對應(yīng)于所述待修正內(nèi)容的新的修改備選項(xiàng),并從所述新的修改備選項(xiàng)中選擇正確內(nèi)容替換所述待修正內(nèi)容;若為重錄指令,則重新獲取對應(yīng)于所述待修正內(nèi)容的語音并修正所述待修正內(nèi)容。
進(jìn)一步的,在上述方法中,所述識別網(wǎng)絡(luò)包括對應(yīng)所述語音的最佳文本序列和候選文本序列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海果殼電子有限公司,未經(jīng)上海果殼電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210101294.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





