[發明專利]一種多語言的智能語音翻譯交互平臺有效
| 申請號: | 202310558501.0 | 申請日: | 2023-05-18 |
| 公開(公告)號: | CN116306705B | 公開(公告)日: | 2023-08-15 |
| 發明(設計)人: | 葛頌;蓋志鵬;趙娜;劉軍禮 | 申請(專利權)人: | 山東省科學院海洋儀器儀表研究所 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/42;G06F18/2321;G06F40/289;G06F40/216;G06N3/04;G06N3/08 |
| 代理公司: | 青島華慧澤專利代理事務所(普通合伙) 37247 | 代理人: | 趙梅 |
| 地址: | 266200 山東省青島市即墨區鰲山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語言 智能 語音 翻譯 交互 平臺 | ||
本發明涉及語言翻譯技術領域,尤其為一種多語言的智能語音翻譯交互平臺,包括:語音錄入模塊:用于采集候選語音并轉換為候選語言譯文;語言選擇模塊:用于供用戶選擇目標語言;語言翻譯模塊:用于將候選語言譯文翻譯成目標語言文本;翻譯優化模塊:用于基于數據挖掘算法挖掘候選語言譯文中的模糊譯詞并進行翻譯優化;語音生成模塊:用于生成最終的目標語言文本并轉化為智能語音進行上傳。本發明通過將采集的語音轉化為文字進行翻譯,通過數據挖掘算法獲取待翻譯的文段中的有多種讀音或多重意思的模糊譯詞,并對模糊譯詞的最佳詞義項進行篩選以實現翻譯優化,并最終生成智能語音,大大提高了翻譯的準確性,便于用戶的理解。
技術領域
本發明涉及語言翻譯技術領域,尤其是一種多語言的智能語音翻譯交互平臺。
背景技術
現有生活中,隨著人工智能與多媒體技術的進步與發展,智能語音技術作為一種新型的信息傳遞方式逐漸被人們發展和利用,語音技術的優勢也大大顯現,現有智能語音逐漸從被動變為主動,很多服務和商業行為都可以通過語音交互技術來實現智能化操作,能夠為用戶提供更加全面的服務?,F有技術中的語音翻譯技術已經較為成熟,但是當遇到有多種讀音或多重意思的文字時,會由于翻譯不準確造成用戶的理解困難。
發明內容
本發明的目的是通過提出一種多語言的智能語音翻譯交互平臺,以解決上述背景技術中提出的缺陷。
本發明采用的技術方案如下:
提供一種多語言的智能語音翻譯交互平臺,包括:
語音錄入模塊:用于采集候選語音并轉換為候選語言譯文;
語言選擇模塊:用于供用戶選擇目標語言;
語言翻譯模塊:用于將候選語言譯文翻譯成目標語言文本;
翻譯優化模塊:用于基于數據挖掘算法挖掘候選語言譯文中的模糊譯詞并進行翻譯優化;
語音生成模塊:用于生成最終的目標語言文本并轉化為智能語音進行上傳。
作為本發明的一種優選技術方案:所述交互平臺以術語庫、語料庫和知識庫綜合構成的語言知識庫作為支撐層。
作為本發明的一種優選技術方案:所述語言翻譯模塊基于語言知識庫中對提取的候選語言譯文進行匹配翻譯。
作為本發明的一種優選技術方案:所述語言翻譯模塊基于長短時記憶網絡對候選語言譯文中的詞向量進行抽取,并基于距離翻譯算法將候選語言譯文翻譯成目標語言譯文。
作為本發明的一種優選技術方案:所述對候選語言譯文中的詞向量進行抽取具體如下:
設詞語中的單詞向量為,經過長短時記憶網絡進行時序語義信息特征抽取后得到單詞特征向量序列為,通過下式計算每個詞語中每一個單詞向量對應的權重,計算獲得當前候選語言譯文中的詞語向量,其中,為候選語言譯文,為候選語言譯文中的句子:
通過下式計算句子中每一個詞向量的權重:
;
;
其中,為長短時記憶網絡的權重矩陣,為長短時記憶網絡的偏置參數,為詞語中第個單詞特征向量,為轉置,為注意力權重,為詞語中的單詞總數。
作為本發明的一種優選技術方案:所述距離翻譯算法中通過詞向量的歐式距離以及權值衡量詞向量間的相似度:
;
其中,表示候選語言譯文輸入的詞語特征,表示目標語言譯文輸入的詞語映射為候選語言時對應的特征;選取其中歐式距離最短時對應的目標語言中的詞語作為目標語言譯文的詞語。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東省科學院海洋儀器儀表研究所,未經山東省科學院海洋儀器儀表研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310558501.0/2.html,轉載請聲明來源鉆瓜專利網。





