[發(fā)明專利]語音識別方法、程序、語音識別裝置和機器人在審
| 申請?zhí)枺?/td> | 201810674290.6 | 申請日: | 2018-06-27 |
| 公開(公告)號: | CN109215631A | 公開(公告)日: | 2019-01-15 |
| 發(fā)明(設(shè)計)人: | 國武勇次;太田雄策 | 申請(專利權(quán))人: | 松下知識產(chǎn)權(quán)經(jīng)營株式會社 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/22;G10L15/26;G10L21/0208 |
| 代理公司: | 北京市中咨律師事務(wù)所 11247 | 代理人: | 劉靜;段承恩 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 話語 可信度 語音識別 語音識別裝置 麥克風(fēng) 語音處理裝置 拾取 機器人 語音 | ||
本公開涉及語音識別方法、程序、語音識別裝置和機器人。在語音識別方法中,從由與所述語音處理裝置對應(yīng)的麥克風(fēng)拾取的語音中提取第一話語,計算所述第一話語的識別結(jié)果和所述第一話語的可信度,基于計算出的所述第一話語的可信度,實施反問話語,由所述麥克風(fēng)提取通過所述反問得到的第二話語,計算所述第二話語的識別結(jié)果和所述第二話語的可信度,基于計算出的所述第二話語的可信度,根據(jù)所述第一話語的識別結(jié)果和所述第二話語的識別結(jié)果,生成識別結(jié)果。
技術(shù)領(lǐng)域
本公開涉及語音識別的技術(shù)。
背景技術(shù)
近年來,提出了根據(jù)說出的語音數(shù)據(jù)來推定表示說話內(nèi)容的單詞串的各種語音識別方法。
例如,在專利文獻1中,公開了下述語音識別方法。即,將說出的語音數(shù)據(jù)劃分為多個音素區(qū)間x,對各音素區(qū)間x分配音素模型,求出對第n個音素區(qū)間x分配的音素模型p的似然度(Likelihood)Psn以及似然度Psn與除音素模型p之外的音素模型的音素區(qū)間x的似然度的最高值Pmaxn之間的差分似然度Pdn。進而,分別將似然度Psn和差分似然度Pdn輸入到正解音素區(qū)間似然度模型和非正解音素似然度模型,求出正解音素區(qū)間似然度模型的似然度Lnc和非正解音素似然度模型的似然度Lni。進而,求出似然度Lnc與似然度Lni的差分似然度cn,求出差分似然度cn的全部音素區(qū)間的相加值作為單詞可信度WC,如果單詞可信度WC為閾值以上,則輸出對該語音數(shù)據(jù)分配的音素串,如果單詞可信度WC小于閾值,則放棄該音素串。
但是,在專利文獻1中,僅考慮了音素似然度,沒有考慮語言似然度,因此存在不能再現(xiàn)作為語言而具有自然感的音素串這樣的問題。
因此,在非專利文獻1中,公開了如下方法:使用音響(聲學(xué))似然度和語言似然度,對話語進行語音識別,推定單詞串。具體而言,在非專利文獻1中,選擇使式(1)的右邊所示的概率之積最大的單詞串W來作為識別結(jié)果。此處,w是任意單詞串,P(O|w)是單詞串w的音素串為O的概率(音響似然度),通過音響模型來計算。P(w)是表示作為w的語言的最大可能性的概率(語言似然度),基于n-gram(n元語法)等連續(xù)單詞的出現(xiàn)頻度信息,通過語言模型來計算。
另外,在該方法中,將該音響似然度和語言似然度之積作為識別結(jié)果的可信度(文章的可信度),與識別結(jié)果一同輸出。
現(xiàn)有技術(shù)文獻
專利文獻1:日本特開平11-249688號公報
非專利文獻1:堀貴明·塚田元著、情報処理學(xué)會誌45巻10號PP.1020-1026、音聲情報処理技術(shù)の最先端:3.重み付き有限狀態(tài)トランスデューサによる音聲認識、2004年10月
發(fā)明內(nèi)容
發(fā)明要解決的問題
但是,在非專利文獻1中,在輸入話語模糊或輸入話語受噪聲等影響較大的情況下,文章的可信度會成為低值。進而,在文章的可信度低的情況下,存在識別結(jié)果中包含錯誤的可能性升高這樣的問題。
本公開是為了解決這樣的問題而完成的。
用于解決問題的手段
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于松下知識產(chǎn)權(quán)經(jīng)營株式會社,未經(jīng)松下知識產(chǎn)權(quán)經(jīng)營株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810674290.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 通信系統(tǒng)的射頻接口發(fā)送和接收RF信號的方法和設(shè)備
- 對話管理方法和執(zhí)行該方法的裝置
- 用于處理口頭話語流的方法、系統(tǒng)和存儲介質(zhì)
- 語音識別方法、程序、語音識別裝置和機器人
- 基于命名實體的解析和識別確定跨文檔的修辭相互關(guān)系
- 學(xué)習(xí)語音識別任務(wù)的轉(zhuǎn)錄錯誤
- 一種基于MCVideo集群系統(tǒng)的話語權(quán)控制方法
- 一種多路通話語音控制方法及裝置
- 基于語言模型的話語訓(xùn)練方法、裝置及計算機設(shè)備
- 服務(wù)滿意度確定方法、裝置、存儲介質(zhì)和計算機設(shè)備
- 雷達模擬設(shè)備可信度的評估方法及評估系統(tǒng)
- 一種基于貝葉斯網(wǎng)絡(luò)的ad-hoc網(wǎng)絡(luò)節(jié)點可信度評估方法
- 一種數(shù)據(jù)資產(chǎn)可信度的評估方法
- 一種用戶可信度的計算方法及裝置
- 一種軟件可信性量化評估與設(shè)計方法
- 目標(biāo)對象可信度的確定方法及裝置
- 一種企業(yè)上報數(shù)據(jù)可信度評估系統(tǒng)及其實現(xiàn)方法
- 基于隸屬度分析的目標(biāo)可信度計算方法及裝置
- 基于不確定性度量的復(fù)雜裝備仿真系統(tǒng)可信度評估方法
- 資源數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì)





