[發(fā)明專(zhuān)利]多識(shí)別器語(yǔ)音識(shí)別有效
| 申請(qǐng)?zhí)枺?/td> | 201480027534.1 | 申請(qǐng)日: | 2014-04-18 |
| 公開(kāi)(公告)號(hào): | CN105229728B | 公開(kāi)(公告)日: | 2019-10-29 |
| 發(fā)明(設(shè)計(jì))人: | 彼塔爾·阿列克西克;佩德羅·J·莫雷諾門(mén)希瓦爾;法迪·比亞德希 | 申請(qǐng)(專(zhuān)利權(quán))人: | 谷歌有限責(zé)任公司 |
| 主分類(lèi)號(hào): | G10L15/32 | 分類(lèi)號(hào): | G10L15/32;G10L15/197;G10L15/30 |
| 代理公司: | 中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 李寶泉;周亞榮 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 識(shí)別 語(yǔ)音 | ||
本說(shuō)明書(shū)的主題可具體體現(xiàn)為方法等,該方法包括接收與發(fā)聲相對(duì)應(yīng)的音頻數(shù)據(jù),獲得使用有限語(yǔ)音識(shí)別器所產(chǎn)生的發(fā)聲的第一轉(zhuǎn)錄。有限語(yǔ)音識(shí)別器包括包含通過(guò)有限語(yǔ)音識(shí)別詞匯所訓(xùn)練的語(yǔ)言模型的語(yǔ)音識(shí)別器,所述有限語(yǔ)音識(shí)別詞匯包括來(lái)自語(yǔ)音命令語(yǔ)法的一個(gè)或多個(gè)項(xiàng),但包括比擴(kuò)展語(yǔ)法的所有項(xiàng)少。獲得使用擴(kuò)展語(yǔ)音識(shí)別器所產(chǎn)生的發(fā)聲的第二轉(zhuǎn)錄。擴(kuò)展語(yǔ)音識(shí)別器包括包含通過(guò)擴(kuò)展語(yǔ)音識(shí)別詞匯所訓(xùn)練的語(yǔ)言模型的語(yǔ)音識(shí)別器,所述擴(kuò)展語(yǔ)音識(shí)別詞匯包括擴(kuò)展語(yǔ)法的所有項(xiàng)。至少基于第一轉(zhuǎn)錄或第二轉(zhuǎn)錄的一部分來(lái)對(duì)發(fā)聲進(jìn)行分類(lèi)。
技術(shù)領(lǐng)域
本公開(kāi)通常涉及語(yǔ)音識(shí)別。
背景技術(shù)
語(yǔ)音識(shí)別包括用于將所講的詞轉(zhuǎn)換成文本的處理。通常,語(yǔ)音識(shí)別系統(tǒng)將口頭發(fā)聲映射成一系列計(jì)算機(jī)可讀語(yǔ)音,并且對(duì)那些語(yǔ)音與和詞相關(guān)的已知語(yǔ)音模式進(jìn)行比較。例如,麥克風(fēng)可以接受下述模擬信號(hào),所述模擬信號(hào)被轉(zhuǎn)換成此后被劃分成更小段的數(shù)字形式。可對(duì)數(shù)字段與所講語(yǔ)言的元素進(jìn)行比較。根據(jù)該比較以及對(duì)發(fā)出那些語(yǔ)音的環(huán)境的分析,系統(tǒng)能夠識(shí)別語(yǔ)音。
典型的語(yǔ)音識(shí)別系統(tǒng)可以包括聲學(xué)模型、語(yǔ)言模型、以及字典。簡(jiǎn)言之,聲學(xué)模型包括可組合以生成詞語(yǔ)、短語(yǔ)等等的集合的各個(gè)語(yǔ)音的數(shù)字表示。語(yǔ)言模型分配一系列詞語(yǔ)將一起在特定句子或短語(yǔ)中出現(xiàn)的概率。字典將語(yǔ)音序列轉(zhuǎn)換成語(yǔ)言模型可理解的詞語(yǔ)。
發(fā)明內(nèi)容
通常,本文檔描述了用于執(zhí)行語(yǔ)音識(shí)別的系統(tǒng)和技術(shù)。通常,通過(guò)兩個(gè)或更多語(yǔ)音識(shí)別器對(duì)用戶(hù)的發(fā)聲進(jìn)行轉(zhuǎn)錄。將每個(gè)識(shí)別器調(diào)到不同詞典。例如,一個(gè)識(shí)別器可以被調(diào)成從擴(kuò)展的(例如多用途)詞典識(shí)別詞,而另一被調(diào)到詞的子集(例如命令關(guān)鍵字)和/或諸如存儲(chǔ)在聯(lián)系人列表中并且在擴(kuò)展詞典中可能不可用的固有姓名這樣的專(zhuān)用詞典。可對(duì)識(shí)別器的轉(zhuǎn)錄進(jìn)行對(duì)準(zhǔn)以提供包括一個(gè)或多個(gè)識(shí)別器中的所選元素的轉(zhuǎn)錄以作為對(duì)用戶(hù)所說(shuō)的轉(zhuǎn)錄。
在本說(shuō)明書(shū)中所描述的主題的方面可具體體現(xiàn)為方法、系統(tǒng)、以及存儲(chǔ)下述可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì),所述指令執(zhí)行包括下述的操作:接收與發(fā)聲相對(duì)應(yīng)的音頻數(shù)據(jù);獲得使用有限語(yǔ)音識(shí)別器所產(chǎn)生的發(fā)聲的第一轉(zhuǎn)錄,其中有限語(yǔ)音識(shí)別器包括包含通過(guò)有限語(yǔ)音識(shí)別詞匯所訓(xùn)練的語(yǔ)言模型的語(yǔ)音識(shí)別器,所述有限語(yǔ)音識(shí)別詞匯包括來(lái)自語(yǔ)音命令語(yǔ)法的一個(gè)或多個(gè)項(xiàng),但包括比擴(kuò)展語(yǔ)法的所有項(xiàng)少;獲得使用擴(kuò)展語(yǔ)音識(shí)別器所產(chǎn)生的發(fā)聲的第二轉(zhuǎn)錄,其中擴(kuò)展語(yǔ)音識(shí)別器包括包含通過(guò)下述擴(kuò)展語(yǔ)音識(shí)別詞匯所訓(xùn)練的語(yǔ)言模型的語(yǔ)音識(shí)別器,所述擴(kuò)展語(yǔ)音識(shí)別詞匯包括擴(kuò)展語(yǔ)法的所有項(xiàng);并且至少根據(jù)第一轉(zhuǎn)錄或第二轉(zhuǎn)錄的一部分來(lái)對(duì)發(fā)聲進(jìn)行分類(lèi)。
實(shí)現(xiàn)可以包括以下特征中的一些、全部、或者沒(méi)有一個(gè)。可以使發(fā)聲的第一和第二轉(zhuǎn)錄對(duì)準(zhǔn)以產(chǎn)生對(duì)準(zhǔn)的轉(zhuǎn)錄。可以將發(fā)聲分類(lèi)為語(yǔ)音命令或語(yǔ)音查詢(xún)中的一個(gè),并且響應(yīng)于將發(fā)聲分類(lèi)為語(yǔ)音命令,使用第一轉(zhuǎn)錄的至少一部分以及第二轉(zhuǎn)錄的至少一部分產(chǎn)生所述語(yǔ)音命令并且發(fā)起語(yǔ)音命令,并且響應(yīng)于將發(fā)聲分類(lèi)為語(yǔ)音查詢(xún),使用第一轉(zhuǎn)錄的至少一部分以及第二轉(zhuǎn)錄的至少一部分產(chǎn)生語(yǔ)音查詢(xún)并且發(fā)起語(yǔ)音查詢(xún)。有限語(yǔ)音識(shí)別器可被配置成識(shí)別占位符項(xiàng)的集合、語(yǔ)音命令項(xiàng)的集合、以及來(lái)自聯(lián)系人列表的聯(lián)系人姓名的集合中的一個(gè)或多個(gè)。擴(kuò)展語(yǔ)音識(shí)別器可被配置成識(shí)別一般語(yǔ)法項(xiàng)的集合、占位符項(xiàng)的集合、固有姓名的集合、以及語(yǔ)音命令項(xiàng)的集合中的一個(gè)或多個(gè)。擴(kuò)展語(yǔ)音識(shí)別器可以不被配置為識(shí)別來(lái)自聯(lián)系人列表的聯(lián)系人姓名的集合。有限語(yǔ)音識(shí)別器和擴(kuò)展語(yǔ)音識(shí)別器中的至少一個(gè)的操作可在移動(dòng)設(shè)備處執(zhí)行。有限語(yǔ)音識(shí)別器和擴(kuò)展語(yǔ)音識(shí)別器中的至少一個(gè)的操作可在服務(wù)器計(jì)算機(jī)設(shè)備處執(zhí)行。
這里所描述的系統(tǒng)和技術(shù)可以提供以下一個(gè)或多個(gè)優(yōu)點(diǎn)。首先,系統(tǒng)可提供對(duì)不為通用語(yǔ)音識(shí)別系統(tǒng)所知的項(xiàng)和姓名的識(shí)別。第二,系統(tǒng)可提高用戶(hù)信息的保密性。第三,系統(tǒng)可提供對(duì)包括在用戶(hù)字典和通用字典中所找到的詞的所講短語(yǔ)的改進(jìn)的識(shí)別。
在附圖和以下說(shuō)明中闡述了一個(gè)或多個(gè)實(shí)現(xiàn)的細(xì)節(jié)。從說(shuō)明書(shū)和附圖以及權(quán)利要求將顯而易見(jiàn)地得知其它特征和優(yōu)點(diǎn)。
附圖說(shuō)明
圖1示出了用于利用多個(gè)語(yǔ)音識(shí)別器來(lái)執(zhí)行語(yǔ)音識(shí)別的系統(tǒng)的示例的示意圖。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于谷歌有限責(zé)任公司,未經(jīng)谷歌有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480027534.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話(huà)者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)





