[發(fā)明專(zhuān)利]基于大數(shù)據(jù)處理及人工干預(yù)的多語(yǔ)言即時(shí)翻譯系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201710170038.7 | 申請(qǐng)日: | 2017-03-21 |
| 公開(kāi)(公告)號(hào): | CN106951416A | 公開(kāi)(公告)日: | 2017-07-14 |
| 發(fā)明(設(shè)計(jì))人: | 胡壹 | 申請(qǐng)(專(zhuān)利權(quán))人: | 成都星陣地科技有限公司 |
| 主分類(lèi)號(hào): | G06F17/28 | 分類(lèi)號(hào): | G06F17/28;H04L12/58 |
| 代理公司: | 北京天奇智新知識(shí)產(chǎn)權(quán)代理有限公司11340 | 代理人: | 楊春 |
| 地址: | 610041 四川*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 數(shù)據(jù)處理 人工 干預(yù) 語(yǔ)言 即時(shí) 翻譯 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種即時(shí)翻譯系統(tǒng),尤其涉及基于大數(shù)據(jù)處理及人工干預(yù)的多語(yǔ)言即時(shí)翻譯系統(tǒng)。
背景技術(shù)
不同語(yǔ)言用戶在互聯(lián)網(wǎng)上即時(shí)通信,需要雙方或多方都需要理解同一種語(yǔ)言,大家用這樣同一種語(yǔ)言進(jìn)行溝通。如果有人不懂這門(mén)語(yǔ)言,必須借助第三方的翻譯工具進(jìn)行翻譯后再再?gòu)?fù)制語(yǔ)言發(fā)送給對(duì)方進(jìn)行交流,這一過(guò)程操作復(fù)雜,效率不高,準(zhǔn)確率差;或者請(qǐng)專(zhuān)業(yè)的翻譯人員將自己要說(shuō)的話翻譯成對(duì)方能夠聽(tīng)懂的語(yǔ)言,成本較高,且部分不宜讓第三方人員知道的信息也可能因?yàn)榉g人員而泄露。
發(fā)明內(nèi)容
本發(fā)明的目的就在于為了解決上述問(wèn)題而提供基于大數(shù)據(jù)處理及人工干預(yù)的多語(yǔ)言即時(shí)翻譯系統(tǒng)。
本發(fā)明通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)上述目的:
一種基于大數(shù)據(jù)處理及人工干預(yù)的多語(yǔ)言即時(shí)翻譯系統(tǒng),包括平行語(yǔ)料庫(kù)和第三方翻譯引擎,其翻譯方法包括以下步驟:
(1)用戶將待翻譯語(yǔ)言輸入至平行語(yǔ)料庫(kù),其中待翻譯語(yǔ)言為文字語(yǔ)言;
(2)平行語(yǔ)料庫(kù)對(duì)待翻譯語(yǔ)言進(jìn)行檢索,判斷平行語(yǔ)料庫(kù)能否直接對(duì)待翻譯語(yǔ)言進(jìn)行翻譯,若能直接翻譯則跳轉(zhuǎn)至步驟(3),若不能直接翻譯則跳轉(zhuǎn)至步驟(4);
(3)平行語(yǔ)料庫(kù)對(duì)內(nèi)部記錄的信息進(jìn)行檢索,然后輸出檢索到的翻譯結(jié)果;
(4)將待翻譯語(yǔ)言輸入至第三方翻譯引擎進(jìn)行翻譯,并輸出翻譯結(jié)果;
(5)對(duì)步驟(3)和步驟(4)輸出的翻譯結(jié)果進(jìn)行人工修正,并將修正后的信息反饋至平行語(yǔ)料庫(kù),持續(xù)對(duì)平行語(yǔ)料庫(kù)內(nèi)的信息進(jìn)行更新。
具體地,上述步驟(5)中人工修正的修正方式如下:
(1)對(duì)雙方或多方聊天中存在的特殊字符、表情、非文字語(yǔ)言進(jìn)行替換篩選或去除;
(2)人工修正人員對(duì)雙方或多方對(duì)話內(nèi)容結(jié)合語(yǔ)境,對(duì)第三方翻譯引擎的翻譯內(nèi)容及時(shí)修改。
具體地,所述方法還包括大數(shù)據(jù)庫(kù),大數(shù)據(jù)庫(kù)對(duì)待翻譯語(yǔ)言的上下文和語(yǔ)言環(huán)境進(jìn)行記錄,同時(shí)記錄每個(gè)使用者的語(yǔ)言特征和內(nèi)容特征,構(gòu)成使用者的獨(dú)立數(shù)據(jù)庫(kù),平行語(yǔ)料庫(kù)翻譯后的語(yǔ)言經(jīng)大數(shù)據(jù)庫(kù)學(xué)習(xí)校核后輸出,其工作步驟如下:
(1)平行語(yǔ)料庫(kù)輸出同一個(gè)待翻譯語(yǔ)言的多種翻譯結(jié)果,并將翻譯結(jié)果輸入至大數(shù)據(jù)庫(kù);
(2)檢索大數(shù)據(jù)庫(kù)內(nèi)的該使用者的獨(dú)立數(shù)據(jù)庫(kù),并結(jié)合待翻譯語(yǔ)句的上下文、語(yǔ)言環(huán)境和使用者的語(yǔ)言特征和內(nèi)容特征進(jìn)行分析篩選,再輸出個(gè)性化的翻譯結(jié)果。
本發(fā)明的有益效果在于:
本發(fā)明基于大數(shù)據(jù)處理及人工干預(yù)的多語(yǔ)言即時(shí)翻譯系統(tǒng)通過(guò)平行語(yǔ)料庫(kù)和第三方翻譯引擎結(jié)合,并形成使用者的獨(dú)立數(shù)據(jù)庫(kù),在大數(shù)據(jù)庫(kù)內(nèi)進(jìn)行校核并篩選,同時(shí)結(jié)合人工修正,使翻譯效果更加智能,更接近專(zhuān)業(yè)人工翻譯,同時(shí)使翻譯引擎具備學(xué)習(xí)功能。
具體實(shí)施方式
下面對(duì)本發(fā)明作進(jìn)一步說(shuō)明:
一種基于大數(shù)據(jù)處理及人工干預(yù)的多語(yǔ)言即時(shí)翻譯系統(tǒng),包括平行語(yǔ)料庫(kù)、大數(shù)據(jù)庫(kù)和第三方翻譯引擎,其翻譯方法包括以下步驟:
(1)用戶將待翻譯語(yǔ)言輸入至平行語(yǔ)料庫(kù),其中待翻譯語(yǔ)言為文字語(yǔ)言;
(2)平行語(yǔ)料庫(kù)對(duì)待翻譯語(yǔ)言進(jìn)行檢索,判斷平行語(yǔ)料庫(kù)能否直接對(duì)待翻譯語(yǔ)言進(jìn)行翻譯,若能直接翻譯則跳轉(zhuǎn)至步驟(3),若不能直接翻譯則跳轉(zhuǎn)至步驟(4);
(3)平行語(yǔ)料庫(kù)對(duì)內(nèi)部記錄的信息進(jìn)行檢索,然后輸出輸出同一個(gè)待翻譯語(yǔ)言的多種翻譯結(jié)果,并將翻譯結(jié)果輸入至大數(shù)據(jù)庫(kù);檢索大數(shù)據(jù)庫(kù)內(nèi)的該使用者的獨(dú)立數(shù)據(jù)庫(kù),并結(jié)合待翻譯語(yǔ)句的上下文、語(yǔ)言環(huán)境和使用者的語(yǔ)言特征和內(nèi)容特征進(jìn)行分析篩選,再輸出個(gè)性化的翻譯結(jié)果。
(4)將待翻譯語(yǔ)言輸入至第三方翻譯引擎進(jìn)行翻譯,并輸出翻譯結(jié)果;
(5)對(duì)步驟(3)和步驟(4)輸出的翻譯結(jié)果進(jìn)行人工修正,并將修正后的信息反饋至平行語(yǔ)料庫(kù),持續(xù)對(duì)平行語(yǔ)料庫(kù)內(nèi)的信息進(jìn)行更新。
其中大數(shù)據(jù)庫(kù)對(duì)待翻譯語(yǔ)言的上下文和語(yǔ)言環(huán)境進(jìn)行記錄,同時(shí)記錄每個(gè)使用者的語(yǔ)言特征和內(nèi)容特征,構(gòu)成使用者的獨(dú)立數(shù)據(jù)庫(kù),平行語(yǔ)料庫(kù)翻譯后的語(yǔ)言經(jīng)大數(shù)據(jù)庫(kù)學(xué)習(xí)校核后輸出。
其工作原理如下:
在雙方或聊天過(guò)程中,改翻譯系統(tǒng)結(jié)合用戶的資料背景,歷史對(duì)話交流習(xí)慣記錄,服務(wù)交易記錄,生成用戶個(gè)性化翻譯數(shù)據(jù)。
在用戶的交流過(guò)程中,發(fā)現(xiàn)當(dāng)用戶講過(guò)同樣的對(duì)話內(nèi)容時(shí),直接用系統(tǒng)自身的平行語(yǔ)料庫(kù)結(jié)合用戶大數(shù)據(jù)庫(kù)中的獨(dú)立數(shù)據(jù)庫(kù)直接翻譯用戶的對(duì)話內(nèi)容,而無(wú)需第三方引擎接入,從而形成準(zhǔn)確率更高的智能翻譯。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于成都星陣地科技有限公司,未經(jīng)成都星陣地科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710170038.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計(jì)算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





