[發(fā)明專利]外源性大詞匯量模型到基于規(guī)則的語(yǔ)音識(shí)別的合并在審
| 申請(qǐng)?zhí)枺?/td> | 201910993287.5 | 申請(qǐng)日: | 2015-01-12 |
| 公開(kāi)(公告)號(hào): | CN110706711A | 公開(kāi)(公告)日: | 2020-01-17 |
| 發(fā)明(設(shè)計(jì))人: | T·威爾遜;S·夸齊;J·維孔多阿;P·法特普里亞 | 申請(qǐng)(專利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類號(hào): | G10L15/32 | 分類號(hào): | G10L15/32;G10L15/30;G10L15/193;G10L15/197 |
| 代理公司: | 72002 永新專利商標(biāo)代理有限公司 | 代理人: | 賈麗萍 |
| 地址: | 美國(guó)華*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音識(shí)別系統(tǒng) 大詞匯量 響應(yīng)發(fā)送 觸發(fā) 結(jié)果發(fā)送 統(tǒng)計(jì)模型 小詞匯量 語(yǔ)音識(shí)別 仲裁算法 錯(cuò)誤率 外源性 音頻流 詞語(yǔ) 傳輸 合并 檢測(cè) 統(tǒng)一 | ||
提供了外源性大詞匯量模型到基于規(guī)則的語(yǔ)音識(shí)別的合并。音頻流由本地小詞匯量、基于規(guī)則的語(yǔ)音識(shí)別系統(tǒng)(SVSRS)接收,并被傳輸至大詞匯量的、基于統(tǒng)計(jì)模型的語(yǔ)音識(shí)別系統(tǒng)(LVSRS)。SVSRS和LVSRS對(duì)音頻執(zhí)行識(shí)別。如果一部分音頻沒(méi)有被SVSRS識(shí)別,則觸發(fā)這樣的規(guī)則:將標(biāo)記插入到識(shí)別結(jié)果中。將該識(shí)別結(jié)果發(fā)送至LVSRS。如果檢測(cè)到標(biāo)記,則對(duì)音頻的指定的一部分執(zhí)行識(shí)別。LVSRS結(jié)果與SVSRS結(jié)果進(jìn)行統(tǒng)一并作為混合響應(yīng)發(fā)送回SVSRS。如果沒(méi)有觸發(fā)混合識(shí)別規(guī)則,則喚起仲裁算法來(lái)確定是SVSRS識(shí)別還是LVSRS識(shí)別具有更小的詞語(yǔ)錯(cuò)誤率。將所確定的識(shí)別作為響應(yīng)發(fā)送至SVSRS。
本申請(qǐng)是申請(qǐng)日為2015年1月12日、申請(qǐng)?zhí)枮?01580004735.4的發(fā)明專利申請(qǐng)“外源性大詞匯量模型到基于規(guī)則的語(yǔ)音識(shí)別的合并”的分案申請(qǐng)。
背景技術(shù)
語(yǔ)音識(shí)別系統(tǒng)大體上可分為兩種類型的系統(tǒng):利用小詞匯量并生成高度精確的結(jié)果的基于規(guī)則的系統(tǒng),或者是利用大詞匯量并以損失特定精確度為代價(jià)而提供識(shí)別的寬泛度的開(kāi)放式的、基于統(tǒng)計(jì)的系統(tǒng)。
語(yǔ)音識(shí)別已經(jīng)成為了諸如移動(dòng)電話、平板計(jì)算機(jī)、可穿戴設(shè)備(例如智能手表等)、便攜式媒體播放機(jī)等之類的小型設(shè)備上的一種有用的工具。用戶可利用各種類型的應(yīng)用來(lái)使用語(yǔ)音識(shí)別系統(tǒng),以執(zhí)行動(dòng)作、回答問(wèn)題、做出推薦等。例如,用戶可說(shuō)出命令以啟動(dòng)文本消息應(yīng)用、說(shuō)出文本消息、并且接著說(shuō)出命令以發(fā)送該文本消息。這樣的設(shè)備上的語(yǔ)音識(shí)別可能受硬件、軟件、和/或處理/存儲(chǔ)器能力的限制。從而,較小型的設(shè)備可以包括基于規(guī)則的語(yǔ)音識(shí)別系統(tǒng),而不包括支持開(kāi)放式語(yǔ)音的大詞匯量模型,這是由于這樣的系統(tǒng)可以消耗的存儲(chǔ)器和處理能力的量。
大詞匯量語(yǔ)音識(shí)別系統(tǒng)可以在單獨(dú)的系統(tǒng)上可用,例如,在遠(yuǎn)程服務(wù)器上。一些小型設(shè)備可以依賴基于網(wǎng)絡(luò)的大詞匯量語(yǔ)音識(shí)別系統(tǒng)來(lái)執(zhí)行識(shí)別,然而,對(duì)網(wǎng)絡(luò)的訪問(wèn)不是總是可用的,而且從計(jì)算的角度而言,將大詞匯量系統(tǒng)托管在小型設(shè)備上可能不可行。
通常,存在結(jié)合兩種類型的語(yǔ)音識(shí)別系統(tǒng)的優(yōu)點(diǎn)的需求,例如,其中,來(lái)自用戶的說(shuō)話話語(yǔ)(utterance)的一部分可以需要以高精度匹配,而話語(yǔ)的另一部分語(yǔ)音可以需要非特定地匹配。本發(fā)明是關(guān)于這些和其他考慮而做出的。
發(fā)明內(nèi)容
提供了該發(fā)明內(nèi)容以用簡(jiǎn)化的形式介紹在下文的具體實(shí)施方式中所進(jìn)一步描述的概念的選擇。該發(fā)明內(nèi)容不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或本質(zhì)特征,也不旨在作為幫助來(lái)確定所要求保護(hù)的主題的范圍。
本發(fā)明的實(shí)施例通過(guò)提供外源性大詞匯量模型到基于規(guī)則的語(yǔ)音識(shí)別的合并來(lái)解決上述和其他問(wèn)題。可以利用本地設(shè)備上的受限的、基于規(guī)則識(shí)別與遠(yuǎn)程的、開(kāi)放式的、基于統(tǒng)計(jì)的識(shí)別的組合,以傳遞包含基于設(shè)備的規(guī)則的特異性以及大語(yǔ)言模型的寬泛度兩者的識(shí)別結(jié)果。
在以下的附圖和說(shuō)明中闡述了一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)。通過(guò)閱讀以下詳細(xì)說(shuō)明并查閱相關(guān)聯(lián)的附圖,其他特征和優(yōu)點(diǎn)將會(huì)顯而易見(jiàn)。應(yīng)當(dāng)理解的是,以下的詳細(xì)說(shuō)明僅僅是解釋性的,而不限制所要求保護(hù)的發(fā)明。
附圖說(shuō)明
包含在本公開(kāi)中并構(gòu)成本公開(kāi)的一部分的附圖示出了本發(fā)明的各種實(shí)施例。在附圖中:
圖1是用于提供外源性大詞匯量模型到基于規(guī)則的語(yǔ)音識(shí)別的合并的系統(tǒng)的一個(gè)實(shí)施例的框圖;
圖2是示出了小詞匯量語(yǔ)音識(shí)別系統(tǒng)和大詞匯量語(yǔ)音識(shí)別系統(tǒng)之間的請(qǐng)求和響應(yīng)事務(wù)的框圖;
圖3A-3C示出了用于提供外源性大詞匯量模型到基于規(guī)則的語(yǔ)音識(shí)別的合并的方法的流程圖;
圖4是示出了計(jì)算設(shè)備的示例物理組件的框圖,其中利用所述計(jì)算設(shè)備可以實(shí)踐本發(fā)明的實(shí)施例;
圖5A和5B是移動(dòng)計(jì)算設(shè)備的簡(jiǎn)化的框圖,其中利用所述移動(dòng)計(jì)算設(shè)備可以實(shí)踐本發(fā)明的實(shí)施例;以及
圖6是其中可以實(shí)踐本發(fā)明的實(shí)施例的分布式計(jì)算系統(tǒng)的簡(jiǎn)化的框圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910993287.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 一種協(xié)助記憶古詩(shī)文的學(xué)習(xí)機(jī)
- 一種協(xié)助記憶古詩(shī)文的學(xué)習(xí)機(jī)
- 對(duì)待測(cè)試語(yǔ)音識(shí)別系統(tǒng)的自動(dòng)測(cè)試方法和裝置
- 共用一套麥克風(fēng)陣列的服務(wù)機(jī)器人雙語(yǔ)音識(shí)別方法
- 一種基于云計(jì)算與置信度計(jì)算的語(yǔ)音識(shí)別方法與系統(tǒng)
- 一種視頻監(jiān)控聯(lián)網(wǎng)系統(tǒng)
- 一種用于智能出行的車輛語(yǔ)音輸入控制方法
- 一種用于智能出行的車輛語(yǔ)音輸入控制系統(tǒng)
- 一種服務(wù)機(jī)器人語(yǔ)音識(shí)別方法
- 語(yǔ)音識(shí)別系統(tǒng)優(yōu)化方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 具有互補(bǔ)語(yǔ)言模型的識(shí)別引擎
- 基于嵌入式環(huán)境下的中文大詞匯量語(yǔ)音查詢方法
- 大詞匯量連續(xù)語(yǔ)音合成方法及終端設(shè)備
- 語(yǔ)音識(shí)別方法及系統(tǒng)
- 一種單詞記憶輔助系統(tǒng)
- 一種用于詞匯量測(cè)試的詞匯篩選方法
- 一種基于詞頻排序及等間距取詞的英語(yǔ)詞匯量檢測(cè)方法
- 一種可隨時(shí)查看結(jié)果的詞匯量測(cè)試方法及其測(cè)試系統(tǒng)、移動(dòng)測(cè)試終端
- 詞匯量水平的測(cè)試方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 外源性大詞匯量模型到基于規(guī)則的語(yǔ)音識(shí)別的合并
- 光控制圖片框架的系統(tǒng)和方法
- 通信協(xié)議偵測(cè)系統(tǒng)及方法
- 基于HTTP的同步方法和裝置
- 無(wú)線通信系統(tǒng)、無(wú)線通信裝置、無(wú)線通信方法和程序
- 一種集成層自動(dòng)路由系統(tǒng)及方法
- 用來(lái)減少無(wú)線裝置的能量消耗的方法和無(wú)線通信系統(tǒng)
- 一種消息響應(yīng)方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 傳播發(fā)現(xiàn)輔助請(qǐng)求和響應(yīng)
- 經(jīng)由條件授權(quán)進(jìn)行處理的方法
- 發(fā)送圖象數(shù)據(jù)前發(fā)送聲明報(bào)文的傳真機(jī)及其控制方法





