[發(fā)明專利]一種基于語義的點(diǎn)選驗(yàn)證碼識(shí)別方法及其裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201811076100.7 | 申請(qǐng)日: | 2018-09-14 |
| 公開(公告)號(hào): | CN109033798A | 公開(公告)日: | 2018-12-18 |
| 發(fā)明(設(shè)計(jì))人: | 黃文瀚;程浩;柳超 | 申請(qǐng)(專利權(quán))人: | 北京金堤科技有限公司 |
| 主分類號(hào): | G06F21/36 | 分類號(hào): | G06F21/36;G06F17/27;G06K9/62;G06N3/08 |
| 代理公司: | 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 王文紅 |
| 地址: | 100000 北京市海淀區(qū)知春*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 驗(yàn)證碼 點(diǎn)選 語義 驗(yàn)證碼圖片 短文本 神經(jīng)網(wǎng)絡(luò)模型 測(cè)試工程師 測(cè)試和評(píng)價(jià) 定位信息 概率矩陣 文本語義 驗(yàn)證方式 字符識(shí)別 字符數(shù) 準(zhǔn)確率 構(gòu)建 網(wǎng)站 測(cè)試 學(xué)習(xí) | ||
本發(fā)明提供了一種基于語義的點(diǎn)選驗(yàn)證碼識(shí)別方法及其裝置,其中所述方法包括:在驗(yàn)證碼圖片中,獲取待選字符的字符數(shù)及字符截圖;構(gòu)建字符識(shí)別神經(jīng)網(wǎng)絡(luò)模型,并得到識(shí)別概率矩陣;確定所述字符截圖對(duì)應(yīng)的短文本;根據(jù)短文本,選取相應(yīng)的待選字符,得到驗(yàn)證碼圖片中待選字符對(duì)應(yīng)的定位信息。本發(fā)明實(shí)現(xiàn)了通過深度學(xué)習(xí)技術(shù),對(duì)基于語義的點(diǎn)選驗(yàn)證碼進(jìn)行識(shí)別,為測(cè)試人員提供一種評(píng)價(jià)基于語義的點(diǎn)選驗(yàn)證碼的有效性的方法,通過本發(fā)明所提供的識(shí)別方法,可實(shí)現(xiàn)簡(jiǎn)單高效的推測(cè)文本語義,極大的提高了對(duì)驗(yàn)證碼識(shí)別的準(zhǔn)確率,且方便實(shí)用,為測(cè)試工程師的對(duì)于網(wǎng)站點(diǎn)選驗(yàn)證方式安全性的測(cè)試和評(píng)價(jià)帶來極大的方便。
技術(shù)領(lǐng)域
本發(fā)明涉及驗(yàn)證碼測(cè)試技術(shù)領(lǐng)域,更具體地說,涉及一種基于語義的點(diǎn)選驗(yàn)證碼識(shí)別方法及其裝置。
背景技術(shù)
驗(yàn)證碼(CAPTCHA)常見于web登錄界面中。優(yōu)良設(shè)計(jì)的驗(yàn)證碼可以被人工識(shí)別,但是很難被自動(dòng)工具識(shí)別,從而達(dá)到保護(hù)網(wǎng)站不被惡意使用的目的。相比于傳統(tǒng)的輸入型驗(yàn)證碼,點(diǎn)選驗(yàn)證碼具有安全性高、對(duì)用戶友好等優(yōu)點(diǎn),逐漸替代傳統(tǒng)驗(yàn)證碼,成為主流方式。
目前點(diǎn)選驗(yàn)證碼中,有一種是基于語義的點(diǎn)選驗(yàn)證碼,的其工作原理如下:服務(wù)端持有一個(gè)豐富的短文本語料庫(kù),通常單條文本的長(zhǎng)度n取3-6字。服務(wù)端隨機(jī)從語料中選擇一條文本,利用圖形庫(kù)生成漢字圖像,并在圖像中加入干擾。然后在一張大的背景圖片中隨機(jī)生成n個(gè)位置(短文本中漢字的數(shù)量),將n個(gè)漢字與背景圖片做融合。服務(wù)端按照文本的語序?qū)個(gè)漢字的位置存儲(chǔ)在session中,用以記錄正確答案。最后將生成的圖片下發(fā)到網(wǎng)頁端,并要求在用戶按照語序點(diǎn)擊圖片中的文字。用戶點(diǎn)擊漢字后,漢字對(duì)應(yīng)的位置信息會(huì)傳到服務(wù)器進(jìn)行校驗(yàn),如過果偏差在閾值規(guī)定的范圍內(nèi),則校驗(yàn)通過,否則不通過。
為了能有效的攔截惡意的訪問,很多網(wǎng)站都部署的驗(yàn)證碼技術(shù)。而在網(wǎng)站上線運(yùn)行前,測(cè)試工程師會(huì)對(duì)網(wǎng)站的驗(yàn)證碼進(jìn)行識(shí)別,以檢測(cè)網(wǎng)站的安全性。如被自動(dòng)化軟件識(shí)別的概率高,則表明網(wǎng)站的驗(yàn)證碼機(jī)制不安全。現(xiàn)有的驗(yàn)證碼識(shí)別技術(shù)主要是針對(duì)輸入型驗(yàn)證碼,以及普通點(diǎn)選型驗(yàn)證碼,而對(duì)于基于語序/語義的點(diǎn)選型驗(yàn)證碼尚未提供解決思路,導(dǎo)致基于語序/語義的點(diǎn)選驗(yàn)證技術(shù)的網(wǎng)站或客戶端無法進(jìn)行驗(yàn)證碼的測(cè)試,存在巨大的安全隱患,給測(cè)試工程師對(duì)于網(wǎng)站或客戶端的點(diǎn)選驗(yàn)證碼安全性的測(cè)試帶來極大的不便。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種基于語義的點(diǎn)選驗(yàn)證碼識(shí)別方法及其裝置以解決現(xiàn)有技術(shù)的不足。
為解決上述問題,本發(fā)明提供1.一種基于語義的點(diǎn)選驗(yàn)證碼識(shí)別方法,包括:
在驗(yàn)證碼圖片中,獲取所述驗(yàn)證碼圖片中所包含的待選字符的字符數(shù)及字符截圖;
構(gòu)建字符識(shí)別神經(jīng)網(wǎng)絡(luò)模型,并通過所述字符識(shí)別神經(jīng)網(wǎng)絡(luò)模型對(duì)所述字符截圖進(jìn)行識(shí)別,得到識(shí)別概率矩陣;
根據(jù)所述字符數(shù)和所述識(shí)別概率矩陣,確定所述字符截圖對(duì)應(yīng)的短文本;
根據(jù)所述短文本,從所述識(shí)別概率矩陣中選取相應(yīng)的待選字符,得到所述驗(yàn)證碼圖片中每個(gè)所述待選字符對(duì)應(yīng)的定位信息。
優(yōu)選地,所述“根據(jù)所述字符數(shù)和所述識(shí)別概率矩陣,確定所述字符截圖對(duì)應(yīng)的短文本”包括:
構(gòu)建短文本語料集;所述短文本語料集中包含有多個(gè)不同預(yù)設(shè)字符數(shù)量的短文本對(duì)應(yīng)的文本語料庫(kù);
選擇與所述字符數(shù)對(duì)應(yīng)的文本語料庫(kù);
根據(jù)所述識(shí)別概率矩陣,計(jì)算所述文本語料庫(kù)中的所有文本的非規(guī)范化概率,得到概率信息集;
提取所述概率信息集中非規(guī)范化概率最大的文本作為所述短文本。
優(yōu)選地,所述“根據(jù)所述識(shí)別概率矩陣,計(jì)算所述文本語料庫(kù)中的所有文本的非規(guī)范化概率,得到概率信息集”包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京金堤科技有限公司,未經(jīng)北京金堤科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811076100.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程
- 一種基于云計(jì)算的驗(yàn)證碼服務(wù)方法和系統(tǒng)
- 驗(yàn)證碼的提供方法及裝置
- 一種基于云計(jì)算的驗(yàn)證碼安全系統(tǒng)及方法
- 驗(yàn)證碼輸入方法和驗(yàn)證碼輸入系統(tǒng)
- 一種用戶身份的驗(yàn)證方法、裝置及終端
- 驗(yàn)證碼請(qǐng)求處理方法、裝置及驗(yàn)證碼處理系統(tǒng)
- 驗(yàn)證碼請(qǐng)求處理方法、裝置及驗(yàn)證碼處理系統(tǒng)
- 驗(yàn)證碼識(shí)別方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種驗(yàn)證碼生成方法及裝置
- 驗(yàn)證碼生成方法和驗(yàn)證碼登錄系統(tǒng)
- 面向語義Web服務(wù)程序設(shè)計(jì)的語義數(shù)據(jù)表示和處理方法
- 一種基于語義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語義匹配方法和系統(tǒng)
- 遠(yuǎn)程語義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語義表征和語義計(jì)算的信號(hào)語義識(shí)別方法
- 語義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種基于循環(huán)趨穩(wěn)動(dòng)態(tài)驗(yàn)證碼圖片的驗(yàn)證方法
- 一種生成圖片驗(yàn)證碼的方法及裝置
- 驗(yàn)證碼處理方法和裝置
- 基于圖片驗(yàn)證碼的驗(yàn)證響應(yīng)方法和系統(tǒng)
- 一種驗(yàn)證方法、服務(wù)器和系統(tǒng)
- 圖片驗(yàn)證碼的處理方法及處理裝置
- 驗(yàn)證碼請(qǐng)求處理方法、裝置及驗(yàn)證碼處理系統(tǒng)
- 一種驗(yàn)證碼校驗(yàn)方法及裝置
- 驗(yàn)證碼識(shí)別方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 驗(yàn)證碼生成方法和驗(yàn)證碼登錄系統(tǒng)





