[發(fā)明專利]基于人工智能的翻譯歷史檢索方法、裝置、設(shè)備和介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201811615689.3 | 申請(qǐng)日: | 2018-12-27 |
| 公開(kāi)(公告)號(hào): | CN109710952B | 公開(kāi)(公告)日: | 2023-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 王一鳴;張睿卿;何中軍;吳華;王海峰 | 申請(qǐng)(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號(hào): | G06F40/47 | 分類號(hào): | G06F40/47;G06F40/44;G06F40/30;G06F18/22 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 人工智能 翻譯 歷史 檢索 方法 裝置 設(shè)備 介質(zhì) | ||
本發(fā)明實(shí)施例公開(kāi)了一種基于人工智能的翻譯歷史檢索方法、裝置、設(shè)備和介質(zhì)。該方法包括:接收待翻譯原文的翻譯歷史檢索請(qǐng)求;在歷史原文與歷史譯文組成的歷史翻譯對(duì)中,根據(jù)待翻譯原文與歷史原文的字符串相似度,得到第一候選歷史翻譯對(duì);根據(jù)待翻譯原文與歷史原文的語(yǔ)義相似度,得到第二候選歷史翻譯對(duì);根據(jù)待翻譯原文的譯文與歷史譯文的字符串相似度,得到第三候選歷史翻譯對(duì);從第二候選歷史翻譯對(duì)和/或第三候選歷史翻譯對(duì),以及第一候選歷史翻譯對(duì)中選擇與待翻譯原文匹配的目標(biāo)歷史翻譯對(duì)。利用上述技術(shù)方案能夠?qū)⑴c原文含義相同,但表達(dá)不同的歷史翻譯結(jié)果展現(xiàn)給譯員,避免將字面相似但含義相差很遠(yuǎn)的歷史翻譯結(jié)果展現(xiàn)給譯員。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及計(jì)算機(jī)輔助翻譯領(lǐng)域,尤其涉及一種基于人工智能的翻譯歷史檢索方法、裝置、設(shè)備和介質(zhì)。
背景技術(shù)
計(jì)算機(jī)輔助翻譯是一種利用機(jī)器翻譯技術(shù)幫助專業(yè)譯員進(jìn)行文獻(xiàn)翻譯的系統(tǒng),同時(shí)提供對(duì)譯員歷史翻譯數(shù)據(jù)進(jìn)行存儲(chǔ)和管理的功能。
對(duì)譯員來(lái)說(shuō),最核心的數(shù)據(jù)是歷史翻譯數(shù)據(jù),高質(zhì)量譯文是譯員通過(guò)長(zhǎng)期的積累得到的,當(dāng)遇到相似的句子時(shí),歷史翻譯信息可以帶給譯員很多參考信息。同時(shí),因?yàn)檎业絻删渫耆粯拥脑木渥拥那闆r很少,所以一般在檢索的時(shí)候會(huì)采用模糊搜索的形式,即會(huì)找到一些相似的句子提供給譯員用來(lái)參考。
這里的模糊搜索一般采用字面匹配的形式,即會(huì)找到若干個(gè)“長(zhǎng)得”比較像的句子。但是原文字面相似和譯文相似并不完全等價(jià),比如“今天天氣是很好的”和“明天天氣會(huì)很好嗎”兩句話從字面上相似度很高,但是英文的譯文卻很不一樣。同時(shí),一些原文完全不同的句子,譯文卻可能很相似,比如“你好”和“嗨”的英文譯文都可以用“hello”。而這兩種情況,通過(guò)字面匹配都無(wú)法很好的解決。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,在本發(fā)明實(shí)施例中提供了一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的基于人工智能的翻譯歷史檢索方法、裝置、設(shè)備和介質(zhì),以通過(guò)查找含義相似的句子而不是字面相似的句子來(lái)進(jìn)行檢索,可以將和原文含義相同,但是表達(dá)不同的歷史翻譯結(jié)果展現(xiàn)給譯員用于參考。
第一方面,本發(fā)明實(shí)施例中提供了一種基于人工智能的翻譯歷史檢索方法,所述方法包括:
接收待翻譯原文的翻譯歷史檢索請(qǐng)求;
在歷史原文與歷史譯文組成的歷史翻譯對(duì)中,根據(jù)所述待翻譯原文與歷史原文的字符串相似度,得到第一候選歷史翻譯對(duì);
根據(jù)所述待翻譯原文與歷史原文的語(yǔ)義相似度,得到第二候選歷史翻譯對(duì);
根據(jù)所述待翻譯原文的譯文與歷史譯文的字符串相似度,得到第三候選歷史翻譯對(duì);
從所述第二候選歷史翻譯對(duì)和/或所述第三候選歷史翻譯對(duì),以及所述第一候選歷史翻譯對(duì)中選擇與所述待翻譯原文匹配的目標(biāo)歷史翻譯對(duì)。
第二方面,本發(fā)明實(shí)施例中還提供了一種基于人工智能的翻譯歷史檢索裝置,所述裝置包括:
檢索請(qǐng)求接收模塊,用于接收待翻譯原文的翻譯歷史檢索請(qǐng)求;
第一候選翻譯模塊,用于在歷史原文與歷史譯文組成的歷史翻譯對(duì)中,根據(jù)所述待翻譯原文與歷史原文的字符串相似度,得到第一候選歷史翻譯對(duì);
第二候選翻譯模塊,用于根據(jù)所述待翻譯原文與歷史原文的語(yǔ)義相似度,得到第二候選歷史翻譯對(duì);
第三候選翻譯模塊,用于根據(jù)所述待翻譯原文的譯文與歷史譯文的字符串相似度,得到第三候選歷史翻譯對(duì);
目標(biāo)翻譯確定模塊,用于從所述第二候選歷史翻譯對(duì)和/或所述第三候選歷史翻譯對(duì),以及所述第一候選歷史翻譯對(duì)中選擇與所述待翻譯原文匹配的目標(biāo)歷史翻譯對(duì)。
第三方面,本發(fā)明實(shí)施例中還提供了一種設(shè)備,所述設(shè)備包括:
一個(gè)或多個(gè)處理器;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811615689.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人
- 一種構(gòu)建多語(yǔ)言網(wǎng)站實(shí)時(shí)翻譯的方法
- 一種待翻譯軟件的翻譯方法及裝置
- 一種待翻譯軟件的翻譯方法及裝置
- 一種CAT系統(tǒng)中翻譯記憶庫(kù)和MT結(jié)合的方法及系統(tǒng)
- 翻譯方法、系統(tǒng)、終端以及存儲(chǔ)介質(zhì)
- 一種文本展示方法及裝置
- 機(jī)器翻譯方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于機(jī)器翻譯引擎的翻譯方法及裝置
- 翻譯系統(tǒng)、翻譯方法、翻譯機(jī)及存儲(chǔ)介質(zhì)
- 文字翻譯方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)





