[發(fā)明專利]一種人名翻譯方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202210949527.3 | 申請(qǐng)日: | 2022-08-09 |
| 公開(公告)號(hào): | CN115310458A | 公開(公告)日: | 2022-11-08 |
| 發(fā)明(設(shè)計(jì))人: | 苑聰虎 | 申請(qǐng)(專利權(quán))人: | 中譯語通科技股份有限公司 |
| 主分類號(hào): | G06F40/45 | 分類號(hào): | G06F40/45;G06K9/62 |
| 代理公司: | 北京興智翔達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 11768 | 代理人: | 郭衛(wèi)芹 |
| 地址: | 100131 北京市石景*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 人名 翻譯 方法 系統(tǒng) 設(shè)備 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
本發(fā)明公開了一種人名翻譯方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述方法包括以下步驟:根據(jù)越南姓氏的越南字母獲取對(duì)應(yīng)的英文字母,并將越南人名單詞的越南字母轉(zhuǎn)為英文字母形式;根據(jù)收集的越南姓氏以及越南人名對(duì)應(yīng)的英文字母,將越南姓氏以及越南人名,轉(zhuǎn)為英文字母形式的男性名字對(duì)照數(shù)據(jù)和英文字母形式的女性名字對(duì)照數(shù)據(jù);利用收集的男性名字對(duì)照數(shù)據(jù)和女性名字對(duì)照數(shù)據(jù)訓(xùn)練一個(gè)性別識(shí)別分類器;通過正則表達(dá)式找中文中以大寫字母開頭連續(xù)兩個(gè)單詞以上的姓名。本發(fā)明能正確轉(zhuǎn)換成中文人名,極大的提高越南人名翻譯的準(zhǔn)確度,提高越南語的機(jī)器翻譯水平。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其是涉及應(yīng)用于用于將越南語中的數(shù)字翻譯成中文的技術(shù),具體地說,涉及一種人名翻譯方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
現(xiàn)有各種網(wǎng)絡(luò)中的翻譯引擎都會(huì)出現(xiàn)很多越南人名不能翻譯成中文的情況,這種情況是翻譯引擎在訓(xùn)練過程中對(duì)于數(shù)據(jù)中不存在的人名可能不能翻譯成中文,從而影響中文整體的閱讀,而且對(duì)于人名并不是能用數(shù)據(jù)窮舉覆蓋的。
有鑒于此特提出本發(fā)明。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)的不足,提供一種人名翻譯方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),能正確轉(zhuǎn)換成中文人名,極大的提高越南人名翻譯的準(zhǔn)確度,提高越南語的機(jī)器翻譯水平。
第一方面,為解決上述技術(shù)問題,本發(fā)明采用技術(shù)方案的基本構(gòu)思是:
一種人名翻譯方法,所述方法包括以下步驟:
步驟1:根據(jù)越南姓氏的越南字母獲取對(duì)應(yīng)的英文字母,并將越南人名單詞的越南字母轉(zhuǎn)為英文字母形式;
步驟2:根據(jù)收集的越南姓氏以及越南人名對(duì)應(yīng)的英文字母,將越南姓氏以及越南人名,轉(zhuǎn)為英文字母形式的男性名字對(duì)照數(shù)據(jù)和英文字母形式的女性名字對(duì)照數(shù)據(jù);
步驟3:利用收集的男性名字對(duì)照數(shù)據(jù)和女性名字對(duì)照數(shù)據(jù)訓(xùn)練一個(gè)性別識(shí)別分類器;
步驟4:通過正則表達(dá)式找中文中以大寫字母開頭連續(xù)兩個(gè)單詞以上的姓名。
在上述任一方案中優(yōu)選的實(shí)施例中,在所述根據(jù)越南姓氏的越南字母獲取對(duì)應(yīng)的英文字母,并將越南人名單詞的越南字母轉(zhuǎn)為英文字母形式之前,還包括:
步驟5:收集越南姓氏數(shù)據(jù);
步驟6:根據(jù)所述越南姓氏數(shù)據(jù),獲取所述越南姓氏的越南字母。
在上述任一方案中優(yōu)選的實(shí)施例中,所述收集越南姓氏數(shù)據(jù),還包括:
步驟51:收集越南人名中固定翻譯的名字。
在上述任一方案中優(yōu)選的實(shí)施例中,所述將越南姓氏以及越南人名,轉(zhuǎn)為英文字母形式的男性名字對(duì)照數(shù)據(jù)和英文字母形式的女性名字對(duì)照數(shù)據(jù),還包括:
將步驟2中找到的人名放入fixed_name查詢是否為固定翻譯,若是,則返回查找結(jié)果,則結(jié)束;
將步驟2中人名查詢是否存在越南語中,若不存在,則結(jié)束。
在上述任一方案中優(yōu)選的實(shí)施例中,所述利用收集的男性名字對(duì)照數(shù)據(jù)和女性名字對(duì)照數(shù)據(jù)訓(xùn)練一個(gè)性別識(shí)別分類器,包括:
利用性別識(shí)別分類器對(duì)步驟2中中查詢到的越南語人名分類,并利用fixed_name對(duì)姓轉(zhuǎn)換,last_man_name或者last_women_name進(jìn)行名字轉(zhuǎn)換,若所有越南詞均轉(zhuǎn)換成漢字返回轉(zhuǎn)換后漢字,否則結(jié)束。
第二方面,一種人名翻譯系統(tǒng),包括:
第一獲取模塊,用于根據(jù)越南姓氏的越南字母獲取對(duì)應(yīng)的英文字母,并將越南人名單詞的越南字母轉(zhuǎn)為英文字母形式;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中譯語通科技股份有限公司,未經(jīng)中譯語通科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210949527.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種PCB板夾具裝置
- 下一篇:一種鋇渣無害化處理方法及其復(fù)合物
- 一種構(gòu)建多語言網(wǎng)站實(shí)時(shí)翻譯的方法
- 一種待翻譯軟件的翻譯方法及裝置
- 一種待翻譯軟件的翻譯方法及裝置
- 一種CAT系統(tǒng)中翻譯記憶庫(kù)和MT結(jié)合的方法及系統(tǒng)
- 翻譯方法、系統(tǒng)、終端以及存儲(chǔ)介質(zhì)
- 一種文本展示方法及裝置
- 機(jī)器翻譯方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于機(jī)器翻譯引擎的翻譯方法及裝置
- 翻譯系統(tǒng)、翻譯方法、翻譯機(jī)及存儲(chǔ)介質(zhì)
- 文字翻譯方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





