[發明專利]特殊語言文字的匹配方法及信息驗證方法和裝置在審
| 申請號: | 202011074846.1 | 申請日: | 2020-10-09 |
| 公開(公告)號: | CN112232337A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 甘宇飛 | 申請(專利權)人: | 支付寶實驗室(新加坡)有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06F40/166 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許振新 |
| 地址: | 新加坡珊頓大*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特殊 語言文字 匹配 方法 信息 驗證 裝置 | ||
本說明書公開了一種特殊語言文字的匹配方法及信息驗證方法和裝置。該方法包括:獲取第一特殊語言文字與第二特殊語言文字的差異音標數量和差異元音數量;基于所述第一特殊語言文字與所述第二特殊語言文字的差異音標數量,確定所述第一特殊語言文字與所述第二特殊語言文字之間的音標編輯距離;基于所述第一特殊語言文字與所述第二特殊語言文字之間的差異元音數量,確定所述第一特殊語言文字與所述第二特殊語言文字之間的元音編輯距離;基于所述第一特殊語言文字與所述第二特殊語言文字之間的元音編輯距離和音標編輯距離,確定所述第一特殊語言文字與所述第二特殊語言文字之間的匹配結果。
技術領域
本文件涉及計算機技術領域,尤其涉及一種特殊語言文字的匹配方法及信息驗證方法和裝置。
背景技術
目前,在金融領域,越來越多的金融公司或機構選擇在線身份驗證的方式來驗證用戶的身份,證明“你是你”。這類驗證方式采用拍攝用戶的身份證件,并且采集用戶的人臉圖像進行匹配驗證的方式,來驗證用戶的人臉圖像中的人臉是否和用戶的身份證件上的人臉一致,以及用戶的身份證件中的身份信息是否與預留的身份信息一致,從而證明“你是你”。這類產品也叫企業電子身份認證信息(electronic Know Your Customer,eKYC)系統。
然而,在eKYC系統應用于一些特殊語言文字比如越南文字等小語種文字的場景中時,由于中特殊語言文字比如越南文字等小語種文字會存在大量的音標符號,而且音標種類繁多,這些音標作為文字的修飾,那么,在通過OCR進行文字識別的過程中,這類文字信息則容易受到打印水平、或證件質量等因素導致識別和匹配錯誤。因此,如何對帶音標的字符進行識別和準確地匹配,仍然需要進一步的解決方案。
發明內容
本說明書實施例提供了一種特殊語言文字的匹配方法及信息驗證方法和裝置,以解決現有技術中在通過OCR對越南文字等帶音標的小語種文字進行文字識別的過程中,這類文字信息則容易受到打印水平、或證件質量等因素導致識別和匹配錯誤的問題。
為解決上述技術問題,本說明書實施例是這樣實現的:
第一方面,提出了一種特殊語言文字的匹配方法,包括:
獲取第一特殊語言文字與第二特殊語言文字的差異音標數量和差異元音數量;
基于所述第一特殊語言文字與所述第二特殊語言文字的差異音標數量,確定所述第一特殊語言文字與所述第二特殊語言文字之間的音標編輯距離;
基于所述第一特殊語言文字與所述第二特殊語言文字之間的差異元音數量,確定所述第一特殊語言文字與所述第二特殊語言文字之間的元音編輯距離;
基于所述第一特殊語言文字與所述第二特殊語言文字之間的元音編輯距離和音標編輯距離,確定所述第一特殊語言文字與所述第二特殊語言文字之間的匹配結果。
第二方面,提出了一種信息驗證方法,包括:
獲取待驗證的信息,所述待驗證的信息中包含特殊語言文字,所述特殊語言文字中包含音標和元音;
確定所述待驗證的信息與預留的信息之間的元音編輯距離和音標編輯距離;
基于所述待驗證的信息與所述預留的信息之間的元音編輯距離和音標編輯距離,對所述待驗證的信息進行驗證。
第三方面,提出了一種特殊語言文字的匹配裝置,包括:
獲取模塊,獲取第一特殊語言文字與第二特殊語言文字的差異音標數量和差異元音數量;
音標編輯距離確定模塊,基于所述第一特殊語言文字與所述第二特殊語言文字的差異音標數量,確定所述第一特殊語言文字與所述第二特殊語言文字之間的音標編輯距離;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶實驗室(新加坡)有限公司,未經支付寶實驗室(新加坡)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011074846.1/2.html,轉載請聲明來源鉆瓜專利網。





