[發明專利]一種基于驗證碼的數據樣本識別系統及其方法有效
| 申請號: | 201910065908.3 | 申請日: | 2019-01-24 |
| 公開(公告)號: | CN109783822B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 陳楊;劉作;陳星辰;韋云;張其卿;廖景航 | 申請(專利權)人: | 中國—東盟信息港股份有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F16/61;H04L67/51;G10L25/51 |
| 代理公司: | 北京天奇智新知識產權代理有限公司 11340 | 代理人: | 譚連香 |
| 地址: | 530200 廣西壯*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 驗證 數據 樣本 識別 系統 及其 方法 | ||
本發明公開了一種基于驗證碼的數據樣本識別系統及其方法,用戶通過用戶終端與數據樣本識別模塊連接,實現兩者的信息互交,用戶通過用戶終端發起校驗請求,通過主要由采集服務器、樣本數據庫、呼叫終端和放音模塊構成的所述數據樣本識別模塊為用戶終端提供驗證與識別服務。使用時,數據樣本識別模塊根據校驗請求調取相應的數據樣本,用戶根據指令通過用戶終端輸入驗證碼和識別結果;數據樣本識別模塊對調取的數據樣本和用戶輸入的樣本進行驗證對比,對比成功則表示識別成功,將該數據樣本存入樣本數據庫,否則丟棄。整個過程,只需用戶驗證參與即可,無需人工現場識別,與傳統人工識別的做法相比,具有數據樣本識別工作量少、識別成本低的特點。
技術領域
本發明涉及一種數據樣本識別技術,特別是一種基于驗證碼的數據樣本識別系統及其方法。
背景技術
隨著人工智能和大數據的迅猛發展,數據樣本的識別與處理顯得越來越重要。越來越多領域采用人工智能來對數據樣本進行識別。雖然現有人工智識別技術較為成熟,但也只能識別大多數常用的文字/語音樣本。因此,現有人工智能識別還是存在部分人工智能無法處理的邊邊角角(例如帶有方言、或個人口音的語音樣本,亦或者是在人工識別系統暫未訓練存儲的樣本等),均需要人工參與來識別,識別范圍存在局限性。對于帶有方言或帶有個人口音的語音樣本的識別,現有技術中常常會尋找具有同一特點或技術人員去到現場來進行現場問答,以得到準確的識別結果。在數據識別過程,人工參與度高,數據樣本的識別成本較高。特別是將識別后的語音樣本進行標記也存在著極大的挑戰。
驗證碼(CAPTCHA)是“Completely?Automated?Public?Turing?test?to?tellComputers?and?Humans?Apart”(全自動區分計算機和人類的圖靈測試)的縮寫,是一種區分用戶是計算機還是人的公共全自動程序。用戶在第三平臺上使用時可防止:惡意破解密碼、刷票、論壇灌水、身份核實等功能,驗證碼已成為很多網站/平臺通行的方式。因此,基于第三平臺并通過驗證碼技術實現數據樣本的識別成為數據識別領域的一大挑戰。
發明內容
本發明的發明目的是,針對上述問題,提供一種基于驗證碼的數據樣本識別系統,本發明基于為第三方平臺提供驗證碼服務的途徑,通過用戶驗證碼的方式識別語音數據對應的文字樣本,從而大量節約成本。
為達到上述目的,本發明所采用的技術方案是:
一種基于驗證碼的數據樣本識別系統,包括用戶終端和數據樣本識別模塊,所述用戶終端與數據樣本識別模塊連接,用以向數據樣本識別模塊發起校驗請求,并顯示數據樣本識別模塊發來的驗證碼;
所述驗證碼包括真實校驗碼和數據樣本,所述真實校驗碼由數據樣本識別模塊根據調取數據樣本的標簽生成,用于校驗對比,為用戶提供驗證服務;所述數據樣本與真實校驗碼綁定關聯為一體,用于數據采集;
所述真實校驗碼顯示在用戶終端上,以使用戶根據該真實校驗碼輸入數據樣本的識別結果,用戶終端將所述識別結果、真實校驗碼和數據樣本關聯為一體,生成一識別驗證碼并發送給數據樣本識別模塊;
所述數據樣本識別模塊與用戶終端連接,用以接收用戶終端的校驗請求,所述數據樣本識別模塊對數據樣本識別時,先是接收用戶終端發來的識別驗證碼;然后將該識別驗證碼依次拆分為數據樣本和含有識別結果的真實校驗碼;接著先對比真實校驗碼,若正確則將數據樣本添加至數據樣本標簽,并存儲該數據樣本;反之,若真實校驗碼錯誤,則返回錯誤并丟棄該數據樣本;
所述數據樣本為圖文樣本或語音樣本。
上述方案中,當所述數據樣本為圖文樣本時,作為優選實施方式,所述數據樣本識別模塊包括采集服務器和樣本數據庫,
所述用戶終端與采集服務器連接,用于與采集服務器進行信息交互并向采集服務器發起驗證請求,同時供用戶終端向采集服務器輸入待識別樣本數據的識別結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國—東盟信息港股份有限公司,未經中國—東盟信息港股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910065908.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





