[發明專利]一種商戶名稱翻譯的方法及設備在審
| 申請號: | 202110426399.X | 申請日: | 2021-04-20 |
| 公開(公告)號: | CN113128240A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 向橋梁 | 申請(專利權)人: | 連通(杭州)技術服務有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/289 |
| 代理公司: | 上海百一領御專利代理事務所(普通合伙) 31243 | 代理人: | 王奎宇 |
| 地址: | 310052 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 商戶 名稱 翻譯 方法 設備 | ||
1.一種商戶名稱翻譯的方法,其中,所述方法包括:
將待翻譯的商戶名稱按照字符級別以及單詞級別進行清洗,得到清洗后的商戶名稱;
識別所述清洗后的商戶名稱中所包含的地址信息、組織形式信息以及店鋪信息,得到第一識別的商戶名稱;
識別所述第一識別的商戶名稱中的行業信息以及企業字號信息,得到第二識別的商戶名稱;
對所述第二識別的商戶名稱進行翻譯,得到翻譯后的商戶名稱。
2.根據權利要求1所述的方法,其中,識別所述清洗后的商戶名稱中所包含的地址信息、組織形式信息以及店鋪信息,包括:
采用地點詞庫和自定義規則識別所述清洗后的商戶名稱中所包含的地址信息,其中,所述地點詞庫包括省、市、縣及區的層次關系;
識別所述清洗后的商戶名稱中所含有的組織形式信息,所述組織形式信息包括個體戶形式和企業形式;
識別所述清洗后的商戶名稱中所包含的店鋪信息,所述店鋪信息包括中心、廣場、商行及商店。
3.根據權利要求1或2所述的方法,其中,識別所述第一識別的商戶名稱中的行業信息以及企業字號信息,包括:
按照分詞識別方式識別所述第一識別的商戶名稱中的行業信息;
根據識別出的行業信息確定企業字號信息。
4.根據權利要求3所述的方法,其中,所述分詞識別方式包括:
將所述第一識別的商戶名稱中的地址信息、組織形式信息以及店鋪信息進行刪除,得到刪除后的商戶名稱;
將所述刪除后的商戶名稱進行句子分詞,得到多個詞組;
從左到右逐一遍歷每一個詞組,判斷所遍歷到的詞組是否在預設的行業詞典中,將在預設的行業詞典中的詞組作為行業詞組;
根據所有的行業詞組確定行業信息。
5.根據權利要求4所述的方法,其中,根據識別出的行業信息確定企業字號信息,包括:
若在識別出的行業信息中包含檢測出的行業詞組,則將檢測到的第一個行業詞組之前的句子作為企業字號信息;
若在識別出的行業信息中未包含檢測出的行業詞組,則將當前的詞組所在的句子作為企業字號信息。
6.根據權利要求5所述的方法,其中,對所述第二識別的商戶名稱進行翻譯之前,包括:
對所述第二識別的商戶名稱中的企業字號信息進行提取目標信息并刪除非法字符,其中,所述目標信息包括中文、拼音以及字母。
7.根據權利要求2所述的方法,其中,對所述第二識別的商戶名稱進行翻譯,包括:
將所述第二識別的商戶名稱按照所屬的組織形式對應的翻譯方式進行翻譯。
8.根據權利要求7所述的方法,其中,將所述第二識別的商戶名稱按照所屬的組織形式對應的翻譯方式進行翻譯,包括:
若所屬的組織形式為個體戶形式,則將所述第二識別的商戶名稱直接進行拼音翻譯,若所述第二識別的商戶名稱對應的商戶類別編碼在自定義詞庫中,則在拼音翻譯結果后面增加使用在自定義詞庫中所述商戶類別對應的英文;
若所屬的組織形式為其它形式,則判斷所述第二識別的商戶名稱中是否包含行業信息,基于判斷結果對所述第二識別的商戶名稱進行翻譯。
9.根據權利要求8所述的方法,其中,基于判斷結果對所述第二識別的商戶名稱進行翻譯,包括:
若所述判斷結果為含有行業信息,則翻譯所述第二識別的商戶名稱的第一個行業詞組對應的英文并對企業字號進行翻譯成拼音;
若所述判斷結果為未含有行業信息且商戶類別編碼在自定義詞庫中,則使用在自定義詞庫中所述商戶類別對應的英文進行翻譯并對企業字號進行翻譯成拼音。
10.根據權利要求5所述的方法,其中,對所述第二識別的商戶名稱進行翻譯,包括:
若所述第二識別的商戶名稱中未包含所述行業企業字號和行業信息時,則將所述第二識別的商戶名稱進行拼音翻譯并截斷成預設數量的字符。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于連通(杭州)技術服務有限公司,未經連通(杭州)技術服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110426399.X/1.html,轉載請聲明來源鉆瓜專利網。





