[發(fā)明專利]用RBH神經(jīng)網(wǎng)絡(luò)模型翻譯德語和普通話的方法在審
| 申請?zhí)枺?/td> | 201710174091.4 | 申請日: | 2017-03-22 |
| 公開(公告)號: | CN108628849A | 公開(公告)日: | 2018-10-09 |
| 發(fā)明(設(shè)計)人: | 邱念 | 申請(專利權(quán))人: | 湖南本來文化發(fā)展有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 410000 湖南省*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 德語 神經(jīng)網(wǎng)絡(luò)模型 翻譯 語法數(shù)據(jù)庫 大數(shù)據(jù)庫 高效低價 模型代替 神經(jīng)網(wǎng)絡(luò) 輸出裝置 音頻采集 用戶提供 漢語 | ||
本發(fā)明公開了一種用RBH神經(jīng)網(wǎng)絡(luò)模型翻譯德語和普通話的方法,包括:1)RBH神經(jīng)網(wǎng)絡(luò)模型、2)普通話的音頻大數(shù)據(jù)庫、3)德語的音頻大數(shù)據(jù)庫、4)漢語語法數(shù)據(jù)庫、5)德語語法數(shù)據(jù)庫、6)音頻采集與輸出裝置,六個模塊構(gòu)成,通過上述模塊,能夠使RBH神經(jīng)網(wǎng)絡(luò)翻譯模型代替專業(yè)的高級翻譯人員迅速高效低價的為用戶提供普通話與德語之間的同傳翻譯。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能中RBH神經(jīng)網(wǎng)絡(luò)模型的應(yīng)用領(lǐng)域,特別是涉及用RBH神經(jīng)網(wǎng)絡(luò)模型翻譯德語和普通話的方法。
背景技術(shù)
隨著國際化進程的加快,同傳翻譯的需求日益增多,而現(xiàn)有的同傳翻譯是由人來完成,專業(yè)的同傳翻譯人員勞動強度大,翻譯準確度易受到個人身體因素的影響,在國際會議中,如果會議的持續(xù)時間長,翻譯人員的體力和精力不斷透支后,將會因疲勞使得翻譯的準確度下降;在個人出國旅游時,由于專業(yè)的同傳翻譯薪資水平高,一般普通群眾較難以接受攜帶翻譯人員出行。
發(fā)明內(nèi)容
本發(fā)明主要解決的技術(shù)問題是提供一種用RBH神經(jīng)網(wǎng)絡(luò)模型翻譯德語和普通話的方法,能夠替代高薪資的高級同傳翻譯,為用戶提供不會因為翻譯時間長而因疲勞導(dǎo)致的翻譯錯誤,RBH神經(jīng)網(wǎng)絡(luò)翻譯模型不僅翻譯速度快,且能夠識別用戶的普通話,特別適用與大型國際會議的翻譯需求。
為解決上述技術(shù)問題,本發(fā)明采用的一個技術(shù)方案是:提供一種用RBH神經(jīng)網(wǎng)絡(luò)模型翻譯德語和普通話的方法,其特征在于,包括:1)RBH神經(jīng)網(wǎng)絡(luò)模型、2)普通話的音頻大數(shù)據(jù)庫、3)德語的音頻大數(shù)據(jù)庫、4)漢語語法數(shù)據(jù)庫、5)德語語法數(shù)據(jù)庫、6)音頻采集與輸出裝置,六個模塊構(gòu)成;為了使人工智能翻譯普通話和德語的速度更快,以滿足語速較快環(huán)境下的同傳翻譯需求,RBH神經(jīng)網(wǎng)絡(luò)模型起到了關(guān)鍵性的作用。
RBH神經(jīng)網(wǎng)絡(luò)翻譯模型的訓(xùn)練方法包括如下步驟:
步驟一、在云計算中心將:普通話大數(shù)據(jù)和德語音頻大數(shù)據(jù)錄入,漢語語法和德語語法數(shù)據(jù)錄入,中文與德語詞典錄入,行業(yè)專有名稱數(shù)據(jù)錄入;
步驟二、在云計算中心對RBH神經(jīng)網(wǎng)絡(luò)模型的輸入層與隱含層進行數(shù)據(jù)建模,RBF神經(jīng)網(wǎng)絡(luò)是一種三層前向網(wǎng)絡(luò),通過輸入層空間到隱含層空間的非線性變換以及隱含層空間到輸出層空間的線性變換,實現(xiàn)輸入層空間到輸出層空間的映射。這兩個層間變換參數(shù)的學(xué)習(xí)可以分別進行,使得RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度較快且可避免局部極小問題;RBF(Radial Basis Function,徑向基函數(shù))是翻譯數(shù)據(jù)沿徑向?qū)ΨQ的標量函數(shù),通常定義為空間中點到某一中心之間歐氏距離的單調(diào)函數(shù),最常用的徑向基函數(shù)是高斯函數(shù),形式為:
其中為函數(shù)中心向量,為寬度向量。高斯函數(shù)的作用域表現(xiàn)出局部性,即當(dāng)遠離時函數(shù)取值較小;RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)從左至右分為三層,依次是輸入層、隱含層和輸出層;
步驟三、將搭載了普通話與德語翻譯大數(shù)據(jù)庫的RBH神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練,其訓(xùn)練方法和公式為:
步驟四:訓(xùn)練完成后,隨機輸入100組普通話發(fā)音的漢語和德語聲音信息,通過錄入RBH神經(jīng)網(wǎng)絡(luò)系統(tǒng)進行翻譯,再人為測定其翻譯準確率,若同傳準確率高于75%且翻譯速度無需等待,則RHB神經(jīng)網(wǎng)絡(luò)翻譯模型訓(xùn)練成功;若低于該值,則重復(fù)步驟三,直至測試值達標為止。
具體實施例
實施例1:在一場耗時達5小時的長時間國際會議上,發(fā)言者語速較快,德方派出的中文同傳翻譯人員,經(jīng)過長時間注意力高度集中的同傳翻譯后,隨著疲勞,導(dǎo)致翻譯準確率逐步下降;此時,中方派出的RBH神經(jīng)網(wǎng)絡(luò)模型用機器對普通話和德語進行同傳翻譯,機器不知疲倦,始終能夠?qū)⒎g準確率維持在穩(wěn)定的高水平位置上,工作能力優(yōu)于人類翻譯人員。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖南本來文化發(fā)展有限公司,未經(jīng)湖南本來文化發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710174091.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種對神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練的方法、裝置及電子設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法以及裝置
- 姿態(tài)檢測方法、裝置、設(shè)備及存儲介質(zhì)
- 基于無標簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型量化方法及裝置
- 神經(jīng)網(wǎng)絡(luò)模型更新方法、圖像處理方法及裝置
- 含有聚類拓撲耦合的神經(jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型的部署方法、設(shè)備及介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化方法、裝置、設(shè)備及存儲介質(zhì)
- 基于框架搜索的深度神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置





