[發明專利]語音傳譯裝置、語音傳譯方法及語音傳譯程序無效
| 申請號: | 201410815097.1 | 申請日: | 2014-12-23 |
| 公開(公告)號: | CN104750677A | 公開(公告)日: | 2015-07-01 |
| 發明(設計)人: | 田中浩之 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G10L15/26 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 劉瑞東;陳海紅 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 傳譯 裝置 方法 程序 | ||
1.一種語音傳譯裝置,具備:
語音識別部,其通過對當前的發話語音進行語音識別處理而生成當前的語音識別結果;
機器翻譯部,其通過將所述當前的語音識別結果從第1語言機器翻譯為第2語言而生成當前的機器翻譯結果;
第1存儲部,其存儲形成當前對話的一個以上的發話的各個的對話歷史;
提取部,其通過從文本組提取短語而獲得短語集合,所述文本組包含所述當前的語音識別結果和所述對話歷史中包含的過去的語音識別結果及機器翻譯結果;
賦予部,其對屬于所述短語集合的每個短語,賦予權重,該權重依賴于成為出現該短語的文本的基礎的發話語音所關聯的對話狀態與當前的對話狀態的差別;
第2存儲部,其存儲多個所述第1語言的用例和該多個第1語言的用例的各個所關聯的所述第2語言的對譯用例;
檢索部,其通過從所述多個第1語言的用例檢索包含所述短語集合中包含的任一短語的用例而獲得命中用例集合;
計算部,其對所述命中用例集合中包含的每個命中用例,計算與所述當前的語音識別結果的相似度;以及
排序部,其基于所述權重及所述相似度計算所述命中用例集合中包含的每個命中用例的得分,基于該得分對所述命中用例集合中包含的命中用例進行排序。
2.權利要求1所述的語音傳譯裝置,其中,
對預定的短語賦予的權重依賴于成為出現該短語的文本的基礎的發話語音的說話者與所述當前的發話語音的說話者的差別。
3.權利要求1所述的語音傳譯裝置,其中,
對預定的短語賦予的權重依賴于成為出現該短語的文本的基礎的發話語音在所述當前對話中的發生順序與所述當前的發話語音在該當前對話中的發生順序的差別。
4.權利要求1所述的語音傳譯裝置,其中,
如果預定的短語出現于多個文本,則所述賦予部通過將依賴于成為該多個文本的各個的基礎的發話語音所關聯的對話狀態與所述當前的對話狀態的差別的權重進行合計,來計算對該短語賦予的權重。
5.權利要求1所述的語音傳譯裝置,其中,
所述文本組包含所述當前的語音識別結果的第2位以后的候選文本、所述過去的語音識別結果的第2位以后的候選文本以及所述過去的機器翻譯結果的第2位以后的候選文本中的至少一個。
6.權利要求5所述的語音傳譯裝置,其中,
對預定的短語賦予的權重,在出現該短語的文本為所述當前的語音識別結果的第2位以后的候選文本、所述過去的語音識別結果的第2位以后的候選文本以及所述過去的機器翻譯結果的第2位以后的候選文本中的任一個的情況下,還依賴于該文本的候選順序。
7.一種語音傳譯方法,包括:
通過對當前的發話語音進行語音識別處理而生成當前的語音識別結果;
通過將所述當前的語音識別結果從第1語言機器翻譯為第2語言而生成當前的機器翻譯結果;
存儲形成當前對話的一個以上的發話的各個的對話歷史;
通過從文本組提取短語而獲得短語集合,所述文本組包含所述當前的語音識別結果和所述對話歷史中包含的過去的語音識別結果及機器翻譯結果;
對屬于所述短語集合的每個短語,賦予權重,該權重依賴于成為出現該短語的文本的基礎的發話語音所關聯的對話狀態與當前的對話狀態的差別;
存儲多個所述第1語言的用例和該多個第1語言的用例的各個所關聯的所述第2語言的對譯用例;
通過從所述多個第1語言的用例檢索包含所述短語集合中包含的任一短語的用例而獲得命中用例集合;
對所述命中用例集合中包含的每個命中用例,計算與所述當前的語音識別結果的相似度;以及
基于所述權重及所述相似度計算所述命中用例集合中包含的每個命中用例的得分,基于該得分對所述命中用例集合中包含的命中用例進行排序。
8.一種語音傳譯程序,其使計算機作為以下單元起作用:
通過對當前的發話語音進行語音識別處理而生成當前的語音識別結果的單元;
通過將所述當前的語音識別結果從第1語言機器翻譯為第2語言而生成當前的機器翻譯結果的單元;
存儲形成當前對話的一個以上的發話的各個的對話歷史的單元;
通過從文本組提取短語而獲得短語集合的單元,所述文本組包含所述當前的語音識別結果和所述對話歷史中包含的過去的語音識別結果及機器翻譯結果;
對屬于所述短語集合的每個短語賦予權重的單元,該權重依賴于成為出現該短語的文本的基礎的發話語音所關聯的對話狀態與當前的對話狀態的差別;
存儲多個所述第1語言的用例和該多個第1語言的用例的各個所關聯的所述第2語言的對譯用例的單元;
通過從所述多個第1語言的用例檢索包含所述短語集合中包含的任一短語的用例而獲得命中用例集合的單元;
對所述命中用例集合中包含的每個命中用例計算與所述當前的語音識別結果的相似度的單元;以及
基于所述權重及所述相似度計算所述命中用例集合中包含的每個命中用例的得分,基于該得分對所述命中用例集合中包含的命中用例進行排序的單元。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝;,未經株式會社東芝;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410815097.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:興趣點動態搜索方法、車載系統
- 下一篇:一種未知格式加密文件的識別方法





