[發(fā)明專利]信息輸入方法和裝置及計算設(shè)備有效
| 申請?zhí)枺?/td> | 201611122247.6 | 申請日: | 2016-12-08 |
| 公開(公告)號: | CN106601254B | 公開(公告)日: | 2020-11-06 |
| 發(fā)明(設(shè)計)人: | 于志超;鄭志輝 | 申請(專利權(quán))人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/22;G06F40/166 |
| 代理公司: | 北京展翼知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11452 | 代理人: | 屠長存 |
| 地址: | 310052 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息 輸入 方法 裝置 計算 設(shè)備 | ||
本發(fā)明公開了一種信息輸入方法和裝置及計算設(shè)備。所述信息輸入方法,包括以下步驟:接收用戶的語音輸入;獲取對所接收的語音輸入的識別結(jié)果;以及使得能夠以文本形式編輯所獲取的識別結(jié)果。利用本發(fā)明的信息輸入機制,尤其是在語音識別內(nèi)容出現(xiàn)少量錯誤的情況下,用戶能夠選擇以文本編輯的形式來修改自動語音識別結(jié)果,由此避免了需要重新語音輸入全部內(nèi)容的麻煩,提高了語音識別效率,提升了用戶體驗。
技術(shù)領(lǐng)域
本發(fā)明總體上涉及語音輸入識別技術(shù)領(lǐng)域,特別是涉及一種允許手動修改語音識別結(jié)果的信息輸入方法和裝置以及計算設(shè)備。
背景技術(shù)
語音識別是現(xiàn)在客戶端普遍采用的應(yīng)用技術(shù),例如廣泛應(yīng)用于智能語音搜索領(lǐng)域以及各種社交通信應(yīng)用中。
例如,用戶在客戶端語音輸入搜索內(nèi)容,客戶端將接收到的語音輸入發(fā)送到通常是遠端的服務(wù)器,服務(wù)器在對語音輸入進行識別后向客戶端返回語音識別結(jié)果以及相應(yīng)的搜索結(jié)果。再例如,用戶在使用允許語音輸入的社交通信軟件時,為了便于用戶以更方便的方式輸入信息,可以選擇將語音對話轉(zhuǎn)換成文本顯示。
然而,在語音識別多句話結(jié)果出現(xiàn)單個文字或詞匯識別錯誤時,在現(xiàn)有技術(shù)中,普遍采用要求用戶重新語音輸入全部內(nèi)容。這使得語音輸入的效率很低,用戶體驗較差,尤其是在只有少數(shù)文字或詞匯有誤的情況下。而且,在語音識別技術(shù)沒有明顯改善的前提下,很可能出現(xiàn)用戶多次語音重新輸入都無法獲得期望的識別結(jié)果。
因此,需要一種能夠解決上述問題,由此提高語音識別效率、改善用戶體驗的信息輸入機制。
發(fā)明內(nèi)容
本發(fā)明的一個目的在于,在語音識別出現(xiàn)錯誤的情況下,以簡單方便的方式修改識別錯誤。
為了實現(xiàn)上述目的,本發(fā)明提供了一種允許手動修改語音識別錯誤的信息輸入機制,使得用戶能夠在發(fā)現(xiàn)自動語音識別出現(xiàn)錯誤的情況下,可以選擇以文本編輯的形式修改識別結(jié)果,由此提高語音識別效率,改善用戶體驗。
根據(jù)本發(fā)明的一個方面,提供了一種信息輸入方法,尤其是一種用于語音檢索的信息輸入方法,包括以下步驟:接收用戶的語音輸入;獲取對所接收的語音輸入的識別結(jié)果;以及使得能夠以文本形式編輯所獲取的識別結(jié)果。
利用本方法,用戶能夠選擇以文本編輯的形式來修改自動語音識別結(jié)果,由此避免了需要重新語音輸入全部內(nèi)容的麻煩,提高了語音識別效率,提升了用戶體驗。本發(fā)明尤其適用于語音識別內(nèi)容出現(xiàn)少量錯誤的情況。
在本發(fā)明的一個實施例中,所述獲取對所接收的語音輸入的識別結(jié)果的步驟包括:將所接收的語音輸入發(fā)送到服務(wù)器端;和接收從服務(wù)器端返回的根據(jù)語音識別模型對所述語音輸入的識別結(jié)果。
在本發(fā)明的一個實施例中,所述信息輸入方法還包括:將以文本形式編輯后的識別結(jié)果反饋給服務(wù)器端,用以訓(xùn)練所述語音識別模型。利用本實施例,服務(wù)器端輸出的針對特定用戶的語音識別結(jié)果的準(zhǔn)確度能夠得到逐步提高。
在本發(fā)明的一個實施例中,所述使得能夠以文本形式編輯所獲取的識別結(jié)果的步驟包括:響應(yīng)于用戶針對所獲取的識別結(jié)果的特定操作,進入文本編輯模式以對所述識別結(jié)果進行修改。
在本發(fā)明的一個實施例中,所述使得能夠以文本形式編輯所獲取的識別結(jié)果的步驟包括:與所述識別結(jié)果相關(guān)聯(lián)地呈現(xiàn)編輯模式標(biāo)識;和響應(yīng)于用戶對所述編輯模式標(biāo)識的觸發(fā),進入文本編輯模式,對所述識別結(jié)果進行修改。
在本發(fā)明的一個實施例中,所述觸發(fā)包括以下中的任一個或多個的組合:針對所述編輯模式標(biāo)識的單擊、雙擊以及懸停。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴(中國)有限公司,未經(jīng)阿里巴巴(中國)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611122247.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





