[發明專利]語音傳譯裝置、語音傳譯方法及語音傳譯程序無效
| 申請號: | 201410815097.1 | 申請日: | 2014-12-23 |
| 公開(公告)號: | CN104750677A | 公開(公告)日: | 2015-07-01 |
| 發明(設計)人: | 田中浩之 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G10L15/26 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 劉瑞東;陳海紅 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 傳譯 裝置 方法 程序 | ||
申請以日本專利申請2013-267918(申請日:2014年12月25日)為基礎,享受該申請的優先權。本申請通過參照該申請,包含該申請的全部內容。
技術領域
實施方式涉及伴隨語音傳譯技術的用例檢索技術。
背景技術
近年,伴隨文化及經濟的全球化,以不同語言為母語的人彼此交流的機會持續增大。因此,相關的交流輔助用的自動傳譯技術備受關注。特別地,作為語音識別技術、自然語言處理技術及機器翻譯技術的應用例的語音傳譯技術,將語音輸入的第1語言的原文機器翻譯為第2語言的譯文,將該譯文呈現給說話者的對話方。若利用相關的語音傳譯技術,則以不同語言為母語的人彼此可以采用各自的母語容易地進行基于語音的交流。
伴隨語音傳譯技術,用例檢索技術也得到靈活運用。用例檢索技術從預先準備的多個用例中,檢索與語音輸入的第1語言的原文意義相似的一個以上的用例。檢索到的相似用例被呈現給說話者。若說話者選擇所呈現的相似用例中的一個,則所選擇的相似用例的對譯用例被呈現給說話者的對話方。從而,即使是原文的語音識別結果不正確的情況,只要說話者可以選擇適當的相似用例,便不必重說也可以正確傳達自己的意思。相關的用例檢索技術中,重要的是向說話者優先地呈現適當的(即,適合說話者的意思的可能性高的)用例。
發明內容
實施方式的目的在于呈現適當的用例。
根據實施方式,語音傳譯裝置具備語音識別部、機器翻譯部、第1存儲部、提取部、賦予部、第2存儲部、檢索部、計算部和排序部。語音識別部通過對當前的發話語音進行語音識別處理而生成當前的語音識別結果。機器翻譯部通過將當前的語音識別結果從第1語言機器翻譯為第2語言而生成當前的機器翻譯結果。第1存儲部存儲形成當前對話的一個以上的發話的各個的對話歷史。提取部通過從文本組提取短語而獲得短語集合,所述文本組包含當前的語音識別結果和對話歷史中包含的過去的語音識別結果及機器翻譯結果。賦予部對屬于短語集合的每個短語,賦予權重,該權重依賴于成為出現該短語的文本的基礎的發話語音所關聯的對話狀態與當前的對話狀態的差別。第2存儲部存儲多個第1語言的用例和該多個第1語言的用例的各個所關聯的第2語言的對譯用例。檢索部通過從多個第1語言的用例檢索包含短語集合中包含的任一短語的用例而獲得命中用例集合。計算部對命中用例集合中包含的每個命中用例,計算與當前的語音識別結果的相似度。排序部基于權重及相似度計算命中用例集合中包含的每個命中用例的得分,基于該得分對命中用例集合中包含的命中用例進行排序。
根據上述構成的語音傳譯裝置,可以呈現適當的用例。
附圖說明
圖1是例示第1實施方式所涉及的語音傳譯裝置的方框圖。
圖2是例示圖1的對話歷史存儲部中存儲的對話歷史的圖。
圖3是例示發話語音的內容、該發話語音的語音識別結果和該語音識別結果的機器翻譯結果的圖。
圖4是例示圖1的短語提取部提取的短語集合的圖。
圖5是例示對屬于圖4所例示的短語集合的每個短語賦予的權重的圖。
圖6是例示由圖1的用例檢索部檢索的命中用例、該命中用例的權重得分、相似度得分及檢索得分的圖。
圖7是例示由圖1的用例排序部進行的命中用例的排序結果的圖。
圖8是表示由圖1的呈現部進行的命中用例及機器翻譯結果的顯示例的圖。
圖9是例示圖1的語音傳譯裝置的工作的流程圖。
圖10是例示圖9的用例檢索處理的流程圖。
圖11是例示圖1的對話歷史存儲部中存儲的對話歷史的圖。
圖12是例示發話語音的內容、該發話語音的語音識別結果和該語音識別結果的機器翻譯結果的圖。
圖13是例示由第2實施方式所涉及的語音傳譯裝置中的短語提取部提取的短語集合的圖。
圖14是例示由第2實施方式所涉及的語音傳譯裝置中的短語提取部從圖11所例示的機器翻譯結果的第2位的候選文本及圖12所例示的語音識別結果的第2位的候選文本進一步提取的短語集合的圖。
圖15是例示對屬于圖13或圖14所例示的短語集合的每個短語賦予的權重的圖。
圖16是例示由第2實施方式所涉及的語音傳譯裝置中的用例檢索部檢索的命中用例和該命中用例的權重得分、相似度得分及檢索得分的圖。
圖17是例示由第2實施方式所涉及的語音傳譯裝置中的用例排序部進行的命中用例的排序結果的圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝;,未經株式會社東芝;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410815097.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:興趣點動態搜索方法、車載系統
- 下一篇:一種未知格式加密文件的識別方法





