[發明專利]語音翻譯設備和語音翻譯方法在審
| 申請號: | 201410472159.3 | 申請日: | 2014-09-16 |
| 公開(公告)號: | CN104462071A | 公開(公告)日: | 2015-03-25 |
| 發明(設計)人: | 釜谷聰史;住田一男;河村聰典 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G10L15/26 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 周良玉;楊曉光 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 翻譯 設備 方法 | ||
技術領域
這里描述的實施例總體上涉及語音翻譯設備和語音翻譯方法。
背景技術
存在有機器翻譯裝置,該機器翻譯裝置用以接受以第一語言描述的源語言的字符串的輸入,并且將字符串翻譯成用第二語言(用戶希望的語言)描述的另一字符串。此外,通過語音語言處理技術的最近發展,實現了用以將一個用戶(第一說話者)說出的第一語言的語音翻譯成第二語言并且輸出至另一用戶(第二說話者)的語音翻譯裝置。
在語音翻譯裝置目前使用的語音識別詞典和翻譯詞典中,僅存儲由開發者提供的在一個范圍內的詞匯。尤其地,在語音翻譯裝置中,通過基于使用該裝置的場景或者情況來限制或者轉換可識別的詞匯和可翻譯的詞匯,性能得以提高。可以通過這樣的事實來想象這個原因,即與不具有前提了解相比,如果用戶具有一些程度的前提了解而聽談話,對于用戶來說,理解談話是更容易的。
在另一方面,在PCT國際公開WO?2009/129315中公開了用以將第一語言的新詞翻譯成第二語言并且將此翻譯結果登記到用于第二語言的語音識別詞典中的技術。
在通過語音詮釋(interpretation)裝置的實際會話中,通過聽相互發聲并且通過在第一和第二說話者之間確認各自的詮釋結果,會話得以推進。對于在另一方的語言(第二說話者的語言)中不存在的詞,例如,在從日語到漢語的翻譯中,或者從日語到英語的翻譯中,該詞被音譯為以拉丁字母方式的表達。此外,在將英語翻譯成日語中,以字母方式的表達將該詞原樣輸出,或者將該詞音譯成以日語字音表(假名)方式的表達。
在這種情況下,當另一方(第二說話者)不可以依據翻譯結果的表達評估語音時,另一方常常基于第一說話者的發聲而發聲。相應地,如果語音識別詞典根據傳統技術僅通過詞的表達而更新,用與語音識別詞典所不同的發音說出該詞,該詞不能被正確地識別。
例如,考慮日語詞“納豆(Nattou)”(發酵的大豆)。該詞被翻譯成漢語“納豆”(拼音(漢語拼音系統):na4dou4)和英語詞“Natto”。當外國人觀看此翻譯結果并且嘗試在接下來的語音中說出此詞時,除了通過觀看他/她的母語的表達的發聲之外,外國人通常通過模仿日語發音“Nattou”而說出。該日語發音“Nattou”沒有直接關聯到漢語詞“納豆”和英語詞“Natto”。相應地,在用以識別外國人的發聲的傳統技術中,該傳統技術僅使用依據翻譯結果的字符串而評估的發音,外國人的發聲的語音識別是失敗的。
此外,為了提高翻譯準確性,考慮將所有可翻譯的詞和所有作為翻譯結果而獲得的詞事先登記到語音識別詞典中。然而,如果可識別的詞的數目無序地增加,生成具有類似于正確詞的發聲的非正確詞的可能性被提高。于是,詮釋準確性并不總是被改善。
發明內容
實施例提供一種語音識別設備和語音識別方法,所述設備和方法能夠識別這樣的詞,該詞對應的發音具有很高的可能性由說話者在流暢會話中說出。
根據一個實施例,一種語音翻譯設備包括語音識別單元、翻譯單元、未知詞檢測單元、發音評估單元和詞典更新單元。所述語音識別單元被配置為,通過使用用以識別第一語言和第二語言的語音識別詞典識別語音,將第一語言的語音轉換成第一語言的源句子。所述翻譯單元被配置為將所述源句子轉換成所述第二語言的翻譯句子。所述未知詞檢測單位被配置為檢測包括在所述翻譯句子中的未知詞。所述未知詞沒有被存儲在所述語音識別詞典中。所述發音評估單元被配置為依據所述未知詞的表達,來評估所述未知詞的第一發音候選,并且依據對應于所述未知詞的、所述源句子中包括的原始詞的發音,來評估所述未知詞的第二發音候選。詞典更新單元被配置為將所述未知詞、所述第一發音候選和所述第二發音候選相應地登記到所述語音識別詞典中。
根據實施例,可以提供一種語音識別設備和一種語音識別方法,所述設備和方法能夠識別這樣的詞,該詞對應的發音具有很高的可能性由說話者在流暢會話中說出。
附圖說明
圖1為根據各種實施例的語音翻譯設備的框圖。
圖2為根據第一實施例的語音翻譯設備的處理的流程圖。
圖3為對應于源語言發音的語音識別結果和翻譯結果的一個實例。
圖4為從圖3的翻譯結果檢測到的未知詞A和B。
圖5為根據第一實施例的發音對應表的一個實例。
圖6為根據第一實施例的登記到語音識別詞典中的發音候選的一個實例。
圖7為根據第二實施例的語音翻譯設備的處理的流程圖。
圖8為根據第二實施例的語際發音對應表的一個實例。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410472159.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種網頁模版的生成方法及裝置
- 下一篇:基于攔截器的分布式數據緩存方法





