[發明專利]一種人名翻譯方法、系統、設備及計算機可讀存儲介質在審
| 申請號: | 202210949527.3 | 申請日: | 2022-08-09 |
| 公開(公告)號: | CN115310458A | 公開(公告)日: | 2022-11-08 |
| 發明(設計)人: | 苑聰虎 | 申請(專利權)人: | 中譯語通科技股份有限公司 |
| 主分類號: | G06F40/45 | 分類號: | G06F40/45;G06K9/62 |
| 代理公司: | 北京興智翔達知識產權代理有限公司 11768 | 代理人: | 郭衛芹 |
| 地址: | 100131 北京市石景*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 人名 翻譯 方法 系統 設備 計算機 可讀 存儲 介質 | ||
1.一種人名翻譯方法,所述方法包括以下步驟:
步驟1:根據越南姓氏的越南字母獲取對應的英文字母,并將越南人名單詞的越南字母轉為英文字母形式;
步驟2:根據收集的越南姓氏以及越南人名對應的英文字母,將越南姓氏以及越南人名,轉為英文字母形式的男性名字對照數據和英文字母形式的女性名字對照數據;
步驟3:利用收集的男性名字對照數據和女性名字對照數據訓練一個性別識別分類器;
步驟4:通過正則表達式找中文中以大寫字母開頭連續兩個單詞以上的姓名。
2.根據權利要求1所述的人名翻譯方法,其特征在于,在所述根據越南姓氏的越南字母獲取對應的英文字母,并將越南人名單詞的越南字母轉為英文字母形式之前,還包括:
步驟5:收集越南姓氏數據;
步驟6:根據所述越南姓氏數據,獲取所述越南姓氏的越南字母。
3.根據權利要求2所述的人名翻譯方法,其特征在于:所述收集越南姓氏數據,還包括:
步驟51:收集越南人名中固定翻譯的名字。
4.根據權利要求3所述的人名翻譯方法,其特征在于:所述將越南姓氏以及越南人名,轉為英文字母形式的男性名字對照數據和英文字母形式的女性名字對照數據,還包括:
將步驟2中找到的人名放入fixed_name查詢是否為固定翻譯,若是,則返回查找結果,則結束;
將步驟2中人名查詢是否存在越南語中,若不存在,則結束。
5.根據權利要求4所述的人名翻譯方法,其特征在于:所述利用收集的男性名字對照數據和女性名字對照數據訓練一個性別識別分類器,包括:
利用性別識別分類器對步驟2中中查詢到的越南語人名分類,并利用fixed_name對姓轉換,last_man_name或者last_women_name進行名字轉換,若所有越南詞均轉換成漢字返回轉換后漢字,否則結束。
6.一種人名翻譯系統,其特征在于:包括:
第一獲取模塊,用于根據越南姓氏的越南字母獲取對應的英文字母,并將越南人名單詞的越南字母轉為英文字母形式;
轉換模塊,用于根據收集的越南姓氏以及越南人名對應的英文字母,將越南姓氏以及越南人名,轉為英文字母形式的男性名字對照數據和英文字母形式的女性名字對照數據;
訓練模塊,用于利用收集的男性名字對照數據和女性名字對照數據訓練一個性別識別分類器;
計算模塊,用于通過正則表達式找中文中以大寫字母開頭連續兩個單詞以上的姓名。
7.根據權利要求6所述的人名翻譯系統,其特征在于:還包括:
收集模塊,用于收集越南姓氏數據;
第二獲取模塊,用于根據所述越南姓氏數據,獲取所述越南姓氏的越南字母。
8.根據權利要求7所述的人名翻譯系統,其特征在于:所述訓練模塊,包括:
分類模塊,用于利用性別識別分類器對查詢到的越南語人名分類,并利用fixed_name對姓轉換,last_man_name或者last_women_name進行名字轉換,若所有越南詞均轉換成漢字返回轉換后漢字,否則結束。
9.一種人名翻譯設備,其特征在于,包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如權利要求1-7中任一所述的人名翻譯方法。
10.一種計算機可讀計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有程序,該程序被處理器執行時實現如權利要求1-7中任一所述的人名翻譯方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中譯語通科技股份有限公司,未經中譯語通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210949527.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種PCB板夾具裝置
- 下一篇:一種鋇渣無害化處理方法及其復合物





