[發(fā)明專利]一種基于語(yǔ)義的點(diǎn)選驗(yàn)證碼識(shí)別方法及其裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201811076100.7 | 申請(qǐng)日: | 2018-09-14 |
| 公開(公告)號(hào): | CN109033798A | 公開(公告)日: | 2018-12-18 |
| 發(fā)明(設(shè)計(jì))人: | 黃文瀚;程浩;柳超 | 申請(qǐng)(專利權(quán))人: | 北京金堤科技有限公司 |
| 主分類號(hào): | G06F21/36 | 分類號(hào): | G06F21/36;G06F17/27;G06K9/62;G06N3/08 |
| 代理公司: | 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 王文紅 |
| 地址: | 100000 北京市海淀區(qū)知春*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 驗(yàn)證碼 點(diǎn)選 語(yǔ)義 驗(yàn)證碼圖片 短文本 神經(jīng)網(wǎng)絡(luò)模型 測(cè)試工程師 測(cè)試和評(píng)價(jià) 定位信息 概率矩陣 文本語(yǔ)義 驗(yàn)證方式 字符識(shí)別 字符數(shù) 準(zhǔn)確率 構(gòu)建 網(wǎng)站 測(cè)試 學(xué)習(xí) | ||
1.一種基于語(yǔ)義的點(diǎn)選驗(yàn)證碼識(shí)別方法,其特征在于,包括:
在驗(yàn)證碼圖片中,獲取所述驗(yàn)證碼圖片中所包含的待選字符的字符數(shù)及字符截圖,所述驗(yàn)證碼圖片中所包含的各個(gè)待選字符的相應(yīng)位置順序是被打亂語(yǔ)序的排序;
構(gòu)建字符識(shí)別神經(jīng)網(wǎng)絡(luò)模型,并通過所述字符識(shí)別神經(jīng)網(wǎng)絡(luò)模型對(duì)所述字符截圖進(jìn)行識(shí)別,得到識(shí)別概率矩陣;
構(gòu)建短文本語(yǔ)料集;所述短文本語(yǔ)料集中包含有多個(gè)不同預(yù)設(shè)字符數(shù)量的短文本對(duì)應(yīng)的文本語(yǔ)料庫(kù);
選擇與所述字符數(shù)對(duì)應(yīng)的文本語(yǔ)料庫(kù);
根據(jù)所述識(shí)別概率矩陣,計(jì)算所述文本語(yǔ)料庫(kù)中的所有文本的非規(guī)范化概率,得到概率信息集;
提取所述概率信息集中非規(guī)范化概率最大的文本作為所述短文本,并獲取待選字符的字符內(nèi)容和對(duì)應(yīng)的語(yǔ)義順序;
根據(jù)所述短文本,從所述識(shí)別概率矩陣中選取相應(yīng)的待選字符,得到所述驗(yàn)證碼圖片中每個(gè)所述待選字符對(duì)應(yīng)的定位信息,建立待選字符與字符截圖以及定位信息的聯(lián)系。
2.如權(quán)利要求1所述基于語(yǔ)義的點(diǎn)選驗(yàn)證碼識(shí)別方法,其特征在于,所述“根據(jù)所述識(shí)別概率矩陣,計(jì)算所述文本語(yǔ)料庫(kù)中的所有文本的非規(guī)范化概率,得到概率信息集”包括:
根據(jù)所述識(shí)別概率矩陣,通過非規(guī)范化概率計(jì)算公式計(jì)算所述文本語(yǔ)料庫(kù)中的所有文本的非規(guī)范化概率,得到概率信息集;其中,所述非規(guī)范化概率計(jì)算公式為:
Ai表示所述文本語(yǔ)料中一短文本序列的第i個(gè)漢字,P(Ai)表示當(dāng)前字是Ai的概率,由所述識(shí)別概率矩陣中給出;A0...An表示所述文本語(yǔ)料庫(kù)中的每一個(gè)短文本序列,短文本序列包括N+1個(gè)漢字,A0表示短文本序列中第0個(gè)漢字,An表示短文本序列中第n個(gè)漢字。
3.如權(quán)利要求1所述基于語(yǔ)義的點(diǎn)選驗(yàn)證碼識(shí)別方法,其特征在于,所述“提取所述概率信息集中非規(guī)范化概率最大的文本作為所述短文本”包括:
對(duì)所述概率信息集中的所有文本,依據(jù)所述非規(guī)范化概率進(jìn)行排序,并根據(jù)概率提取公式提取其中非規(guī)范化概率最大的文本作為所述短文本;其中,所述概率提取公式為:
ArgmaxtextP(text),text∈D;其中,D表示所述文本語(yǔ)料庫(kù),text表示所述文本語(yǔ)料庫(kù)中非規(guī)范化概率最大的短文本。
4.如權(quán)利要求1所述基于語(yǔ)義的點(diǎn)選驗(yàn)證碼識(shí)別方法,其特征在于,所述“根據(jù)所述短文本,從所述識(shí)別概率矩陣中選取相應(yīng)的待選字符,得到所述驗(yàn)證碼圖片中每個(gè)所述待選字符對(duì)應(yīng)的定位信息”包括:
根據(jù)所述短文本和所述字符截圖在所述驗(yàn)證碼圖片中的位置,構(gòu)建空間位置概率矩陣;
定位出所述空間位置概率矩陣中的所述短文本中的每個(gè)待選字對(duì)應(yīng)的最大概率值;
刪除所述最大概率值所在的行和列中除所述最大概率值以外的所有數(shù)據(jù),得到新的目標(biāo)概率矩陣區(qū);
根據(jù)所述新的目標(biāo)概率矩陣區(qū)確定所述驗(yàn)證碼圖片中每個(gè)所述待選字符對(duì)應(yīng)的定位信息。
5.如權(quán)利要求1所述基于語(yǔ)義的點(diǎn)選驗(yàn)證碼識(shí)別方法,其特征在于,所述“在驗(yàn)證碼圖片中,獲取所述驗(yàn)證碼圖片中所包含的待選字符的字符數(shù)及字符截圖”包括:
獲取包括預(yù)先標(biāo)記出的每個(gè)所述待選字符的最小截圖的預(yù)設(shè)字符訓(xùn)練集;
利用所述預(yù)設(shè)字符訓(xùn)練集對(duì)深度學(xué)習(xí)檢測(cè)框架進(jìn)行訓(xùn)練;
基于所述深度學(xué)習(xí)檢測(cè)框架,對(duì)所述驗(yàn)證碼圖片中所包括的待選字符進(jìn)行框定,得到與所述待選字符對(duì)應(yīng)字符數(shù)和字符位置信息;
根據(jù)所述字符位置信息獲取所述驗(yàn)證碼圖片中每個(gè)所述待選字符的最小截圖作為字符截圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京金堤科技有限公司,未經(jīng)北京金堤科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811076100.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程
- 一種基于云計(jì)算的驗(yàn)證碼服務(wù)方法和系統(tǒng)
- 驗(yàn)證碼的提供方法及裝置
- 一種基于云計(jì)算的驗(yàn)證碼安全系統(tǒng)及方法
- 驗(yàn)證碼輸入方法和驗(yàn)證碼輸入系統(tǒng)
- 一種用戶身份的驗(yàn)證方法、裝置及終端
- 驗(yàn)證碼請(qǐng)求處理方法、裝置及驗(yàn)證碼處理系統(tǒng)
- 驗(yàn)證碼請(qǐng)求處理方法、裝置及驗(yàn)證碼處理系統(tǒng)
- 驗(yàn)證碼識(shí)別方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種驗(yàn)證碼生成方法及裝置
- 驗(yàn)證碼生成方法和驗(yàn)證碼登錄系統(tǒng)
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種基于循環(huán)趨穩(wěn)動(dòng)態(tài)驗(yàn)證碼圖片的驗(yàn)證方法
- 一種生成圖片驗(yàn)證碼的方法及裝置
- 驗(yàn)證碼處理方法和裝置
- 基于圖片驗(yàn)證碼的驗(yàn)證響應(yīng)方法和系統(tǒng)
- 一種驗(yàn)證方法、服務(wù)器和系統(tǒng)
- 圖片驗(yàn)證碼的處理方法及處理裝置
- 驗(yàn)證碼請(qǐng)求處理方法、裝置及驗(yàn)證碼處理系統(tǒng)
- 一種驗(yàn)證碼校驗(yàn)方法及裝置
- 驗(yàn)證碼識(shí)別方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 驗(yàn)證碼生成方法和驗(yàn)證碼登錄系統(tǒng)





