[發明專利]采用BP神經網絡同傳翻譯粵語口音與泰語的同傳箱在審
| 申請號: | 201710173370.9 | 申請日: | 2017-03-22 |
| 公開(公告)號: | CN108628845A | 公開(公告)日: | 2018-10-09 |
| 發明(設計)人: | 邱念 | 申請(專利權)人: | 湖南本來文化發展有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 410000 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 翻譯 粵語 云計算中心 人工智能 大數據庫 會議席位 節約空間 主體部件 資金成本 傳統的 配件 疲勞 擺放 替代 會議 | ||
1.采用BP神經網絡同傳翻譯粵語口音與泰語的同傳箱,其特征在于,由以下部件構成:
1)翻譯粵語和泰語的同傳箱主體部件
2)同傳箱配件
3)云計算中心的粵語和泰語大數據庫
4)云計算中心搭載的BP神經網絡模塊。
2.根據權利要求1所述的部件1),其特征在于:本發明的同傳箱為箱式結構硬件,因其采用人工智能的翻譯形式,故該同傳箱與傳統的同傳箱相比,箱內無需坐人,可以節約同傳箱空間,能夠為會議現場留出更多的會議席位擺放空間;在同傳箱的箱體中,設置有:各音頻通道的線纜接線盒,用于連接每位用戶坐席上的耳機線與話筒線;光纖接線盒,用于通過光纖與云計算中心進行實時通信;備用電源;各音頻通道的開關與總開關。
3.根據權利要求1所述的部件2),其特征在于:部件2)一端接在部件1)的各通道音頻接線口上,另一端接在各與會人員坐席上。
4.根據權利要求1所述的部件3),其特征在于:大數據庫具有不少于100TB的存儲空間,且大數據庫根據數據類型分為若干個子數據庫;子數據庫至少需包括以下幾個:粵語音頻大數據庫、泰語音頻大數據庫、漢語語法及粵語發音規則數據、泰語語法及泰語發音規則數據、漢語大辭典、泰語大辭典。
5.根據權利要求1所述的部件4),其特征在于:部件4)需要對部件3)所述的數個大數據庫進行數據勾連后,進行翻譯大數據的深度學習才能起到翻譯粵語和泰語的作用。
6.根據權利要求1所述的部件4),其特征在于:BP神經網絡模型的訓練,其訓練方法包括如下步驟:
步驟(1)、對大數據庫進行數據分析與標注,形成N個訓練樣本;
步驟(2)、對n進行賦值,對于網絡的輸入層各節點的輸出等于輸入;對于中間的隱藏層,節點J的輸入可表示為:
其中:為單元J的活性偏量,一般取[-1,1]
步驟(3)、BP網絡取連續型的激勵函數,其形式如:
從可以得到節點j的輸出:
步驟(4)、重復步驟(2)和步驟(3)的計算過程,直至得到輸出層的實際輸出然后比較實際輸出與期望輸出,通過誤差修改權重和偏置,使得誤差達到最小,對于輸出單元k誤差的形式為:
其中,為輸出層單元的期望輸出,為了避免陷入局部最優解,通過更新權重和偏量,學習率取,可以得到
同理,更新隱含層單元j與上一層單元i的權重和偏量可以得到
。
7.根據權利要求6所述的BP神經網絡對粵語語音和泰語語音的翻譯大數據的訓練,其特征在于:訓練的結果需達到同傳翻譯正確率70%以上才達標,若翻譯準確率低于標準值,則重復權利要求6所述的訓練步驟,并延長BP神經網絡對翻譯大數據的訓練時間,直至測試結果的翻譯準確率達標為止。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南本來文化發展有限公司,未經湖南本來文化發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710173370.9/1.html,轉載請聲明來源鉆瓜專利網。





