[發(fā)明專利]聲音識別糾錯裝置、聲音識別糾錯方法以及聲音識別糾錯程序在審
| 申請?zhí)枺?/td> | 202010922258.2 | 申請日: | 2020-09-04 |
| 公開(公告)號: | CN113362817A | 公開(公告)日: | 2021-09-07 |
| 發(fā)明(設(shè)計)人: | 蘆川平;藤村浩司;巖田憲治 | 申請(專利權(quán))人: | 株式會社東芝 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/28;G10L15/04 |
| 代理公司: | 中國貿(mào)促會專利商標(biāo)事務(wù)所有限公司 11038 | 代理人: | 程晨 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聲音 識別 糾錯 裝置 方法 以及 程序 | ||
實施方式涉及聲音識別糾錯裝置、聲音識別糾錯方法以及聲音識別糾錯程序。提供自動地糾正聲音識別結(jié)果的錯誤的聲音識別糾錯技術(shù)。根據(jù)實施方式,糾錯部計算作為對新的一系列的聲音數(shù)據(jù)進(jìn)行聲音識別而得到的結(jié)果的糾錯對象的聲音識別結(jié)果列和修正網(wǎng)絡(luò)保持部中保持的修正網(wǎng)絡(luò)的差分,如果表示該差分的值在閾值以下,則使用修正網(wǎng)絡(luò)進(jìn)行針對糾錯對象的聲音識別結(jié)果列中的聲音識別的錯誤部分的糾錯,生成聲音識別糾錯結(jié)果列。
本申請以日本專利申請2020-036631(申請日:2020年3月4日)為基礎(chǔ),從該申請享受優(yōu)先的利益。本申請通過參照該申請而包含該申請的所有內(nèi)容。
技術(shù)領(lǐng)域
實施方式涉及聲音識別糾錯裝置、聲音識別糾錯方法以及聲音識別糾錯程序。
背景技術(shù)
聲音識別裝置是利用大詞匯量連續(xù)聲音識別技術(shù)識別人類的聲音的裝置,用于輸入支持、聲音對話等。
在該聲音識別裝置中,由于發(fā)聲時的環(huán)境、說法方式、未知詞等理由,存在聲音識別結(jié)果中包含錯誤的可能性。因此,提出了利用過去的修正歷史、與特定的項目對應(yīng)的數(shù)據(jù)庫來校正識別結(jié)果的聲音識別糾錯技術(shù)。
然而,在以往的聲音識別糾錯技術(shù)中,無法自動地糾正聲音識別結(jié)果的錯誤的情況較多。
發(fā)明內(nèi)容
本發(fā)明想要解決的問題在于提供一種自動地糾正聲音識別結(jié)果的錯誤的聲音識別糾錯技術(shù)。
實施方式的聲音識別糾錯裝置具備修正網(wǎng)絡(luò)保持部和糾錯部。修正網(wǎng)絡(luò)保持部保存修正網(wǎng)絡(luò),該修正網(wǎng)絡(luò)是將作為對一系列的聲音數(shù)據(jù)進(jìn)行聲音識別而得到的結(jié)果的聲音識別結(jié)果列和針對該聲音識別結(jié)果列的基于用戶的修正結(jié)果關(guān)聯(lián)起來的。糾錯部計算作為對新的一系列的聲音數(shù)據(jù)進(jìn)行聲音識別而得到的結(jié)果的糾錯對象的聲音識別結(jié)果列和上述修正網(wǎng)絡(luò)保持部中保持的上述修正網(wǎng)絡(luò)的差分,如果表示上述差分的值在閾值以下,則使用上述修正網(wǎng)絡(luò)進(jìn)行針對上述糾錯對象的聲音識別結(jié)果列中的聲音識別的錯誤部分的糾錯,生成聲音識別糾錯結(jié)果列。
根據(jù)上述結(jié)構(gòu)的聲音識別糾錯裝置,能夠自動地糾正聲音識別結(jié)果的錯誤。
附圖說明
圖1是示出第1實施方式所涉及的聲音識別糾錯裝置的結(jié)構(gòu)的框圖。
圖2是示出聲音識別糾錯裝置的硬件結(jié)構(gòu)的一個例子的框圖。
圖3是示出聲音識別糾錯裝置的處理功能的過程的流程圖。
圖4是示出圖3中的修正網(wǎng)絡(luò)追加/更新處理的詳細(xì)的處理過程的流程圖。
圖5是示出識別結(jié)果文本、修正語句文本以及差分信息的一個例子的圖。
圖6是示出修正網(wǎng)絡(luò)FST的一個例子的圖。
圖7是示出與圖6的例子對應(yīng)的預(yù)讀表的內(nèi)容例的圖。
圖8是示出以單詞為單位進(jìn)行處理的情況下的修正網(wǎng)絡(luò)FST的一個例子的圖。
圖9是示出以單詞為單位進(jìn)行處理的情況下的詞格的一個例子的圖。
圖10是示出以單詞為單位進(jìn)行處理的情況下的混淆網(wǎng)絡(luò)的一個例子的圖。
圖11是示出第2實施方式所涉及的聲音識別糾錯裝置的結(jié)構(gòu)的框圖。
圖12A是示出表示第2實施方式所涉及的聲音識別糾錯裝置的處理的過程的流程圖的第1部分的圖。
圖12B是示出表示第2實施方式所涉及的聲音識別糾錯裝置的處理的過程的流程圖的第2部分的圖。
(符號說明)
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會社東芝,未經(jīng)株式會社東芝許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010922258.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





