[發(fā)明專利]一種姓名識(shí)別方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201710532671.6 | 申請(qǐng)日: | 2017-07-03 |
| 公開(kāi)(公告)號(hào): | CN107247708B | 公開(kāi)(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計(jì))人: | 施懿;金鼎立 | 申請(qǐng)(專利權(quán))人: | 中國(guó)銀行股份有限公司 |
| 主分類(lèi)號(hào): | G06F40/284 | 分類(lèi)號(hào): | G06F40/284;G06F40/237;G06F16/903 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100818 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 姓名 識(shí)別 方法 系統(tǒng) | ||
本發(fā)明公開(kāi)了一種姓名識(shí)別方法及系統(tǒng),建立漢語(yǔ)拼音詞庫(kù),將待檢詞匯中的字符串與漢語(yǔ)拼音詞庫(kù)中的拼音字段進(jìn)行匹配,確定待檢詞匯中的字符串包括的所有拼音字段,待檢詞匯中的字符串包括的所有拼音字段中包括至少兩個(gè)拼音字段,按照該至少兩個(gè)拼音字段中的字符順序能夠組成待檢詞匯中的字符串時(shí),待檢詞匯為中文拼音詞匯,即確定了待檢詞匯為中文姓名。本方案通過(guò)建立漢語(yǔ)拼音詞庫(kù),并將待檢詞匯與漢語(yǔ)拼音詞庫(kù)進(jìn)行匹配,從而確定待檢詞匯是否為中文拼音詞匯,實(shí)現(xiàn)了將待檢詞匯明確為中文詞匯還是英文詞匯,避免了模糊匹配造成的不準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及識(shí)別領(lǐng)域,尤其涉及一種姓名識(shí)別方法及系統(tǒng)。
背景技術(shù)
中國(guó)人的姓名通常為兩個(gè)字或三個(gè)字,用漢語(yǔ)拼音的形式可以有多重排列組合的情況。當(dāng)中國(guó)人姓名通過(guò)漢語(yǔ)拼音來(lái)表示的情況下,在不能明確待檢詞匯是英文詞匯還是中文姓名的時(shí)候,無(wú)法確認(rèn)待檢詞匯中是否包含中文姓名。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種姓名識(shí)別方法及系統(tǒng),以解決現(xiàn)有技術(shù)中在不能明確待檢詞匯是英文詞匯還是中文姓名的時(shí)候,無(wú)法確認(rèn)待檢詞匯中是否包含中文姓名的問(wèn)題,其具體方案如下:
一種姓名識(shí)別方法,包括:
建立漢語(yǔ)拼音詞庫(kù);
將待檢詞匯中的字符串與所述漢語(yǔ)拼音詞庫(kù)中的拼音字段進(jìn)行匹配,確定所述待檢詞匯中的字符串包括的所有拼音字段;
當(dāng)所述待檢詞匯中的字符串包括的所有拼音字段中包括至少兩個(gè)拼音字段,按照所述至少兩個(gè)拼音字段中的字符順序組成所述待檢詞匯中的字符串時(shí),所述待檢詞匯為中文拼音詞匯。
進(jìn)一步的,還包括:
確定待檢詞匯,去掉所述待檢詞匯的字符串中的無(wú)意義字符,所述無(wú)意義字符包括:特殊字符及空格。
進(jìn)一步的,所述確定所述待檢詞匯中的字符串包括的所有拼音字段,包括:
確定所述待檢詞匯中的字符串包括的所有拼音字段,標(biāo)記所述字符串包括的所有拼音字段中每一個(gè)拼音字段的第一個(gè)字符在所述待檢詞匯的字符串中的位置,及所述每一個(gè)拼音字段包括的字符數(shù)。
進(jìn)一步的,所述按照所述至少兩個(gè)拼音字段中的字符順序組成所述待檢詞匯中的字符串,包括:
按照所述至少兩個(gè)拼音字段中每一個(gè)拼音字段第一個(gè)字符在所述待檢詞匯的字符串中的位置及每一個(gè)拼音字段包括的字符數(shù)進(jìn)行順序排列,得到所述待檢詞匯中的字符串。
進(jìn)一步的,所述按照所述至少兩個(gè)拼音字段中的字符順序組成所述待檢詞匯中的字符串,包括:
通過(guò)管道函數(shù),確定按照所述至少兩個(gè)拼音字段中的字符順序組成所述待檢詞匯中的字符串。
一種姓名識(shí)別系統(tǒng),包括:建立單元,與所述建立單元相連的匹配單元,與所述匹配單元相連的確定單元,其中:
所述建立單元用于建立漢語(yǔ)拼音詞庫(kù);
所述匹配單元用于將待檢詞匯中的字符串與所述漢語(yǔ)拼音詞庫(kù)中的拼音字段進(jìn)行匹配,確定所述待檢詞匯中的字符串包括的所有拼音字段;
所述確定單元用于當(dāng)所述待檢詞匯中的字符串包括的所有拼音字段中包括至少兩個(gè)拼音字段,按照所述至少兩個(gè)拼音字段中的字符順序組成所述待檢詞匯中的字符串時(shí),將所述待檢詞匯確定為中文拼音詞匯。
進(jìn)一步的,還包括:處理單元,其中:
所述處理單元用于確定待檢詞匯,去掉所述待檢詞匯的字符串中的無(wú)意義字符,所述無(wú)意義字符包括:特殊字符及空格。
進(jìn)一步的,所述匹配單元確定所述待檢詞匯中的字符串包括的所有拼音字段,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)銀行股份有限公司,未經(jīng)中國(guó)銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710532671.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 區(qū)分亞洲語(yǔ)言寫(xiě)入系統(tǒng)中姓名的系統(tǒng)
- 標(biāo)識(shí)相關(guān)名稱
- 一種自動(dòng)校對(duì)姓名的方法及裝置
- 抽取姓名詞典和翻譯規(guī)則表的方法和設(shè)備
- 一種數(shù)據(jù)庫(kù)蜜罐中姓名字段的構(gòu)造方法及系統(tǒng)
- 一種信息轉(zhuǎn)換方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 中文姓名模糊匹配的方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 姓名比對(duì)方法及裝置
- 一種預(yù)測(cè)真實(shí)姓名的方法、裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
- 姓名文本處理方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





