[發明專利]一種基于驗證碼的語音數據樣本采集系統及其方法在審
| 申請號: | 201910065909.8 | 申請日: | 2019-01-24 |
| 公開(公告)號: | CN109785834A | 公開(公告)日: | 2019-05-21 |
| 發明(設計)人: | 劉作;陳楊;羅一鳴;張強;黃忠山;郭夏杰 | 申請(專利權)人: | 中國—東盟信息港股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L17/02;G06F3/16 |
| 代理公司: | 北京天奇智新知識產權代理有限公司 11340 | 代理人: | 譚連香 |
| 地址: | 530200 廣西壯*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 采集模塊 用戶終端 語音驗證 語音樣本 語音數據樣本 標準文字 采集系統 校驗請求 樣本數據 驗證碼 服務器 語音 采集 樣本數據庫 采樣成本 傳統人工 呼叫終端 文字內容 現場采集 驗證對比 驗證服務 樣本采集 朗讀 錄入 工作量 丟棄 樣本 驗證 指令 成功 | ||
1.一種基于驗證碼的語音數據樣本采集系統,其特征在于:包括用戶終端和語音驗證及采集模塊,
所述用戶終端與語音驗證及采集模塊連接,用以向語音驗證及采集模塊發起校驗請求,用戶根據語音驗證及采集模塊發來的指令朗讀文字樣本數據中的文字內容,并對應生成語音樣本,所述語音樣本由用戶終端發送給語音驗證及采集模塊,所述文字樣本數據包括文字樣本和編號;
所述語音驗證及采集模塊用以接收用戶終端的校驗請求,并根據校驗請求向用戶終端發送待識別的文字樣本數據,同時接收用戶終端發來的語音樣本且將該語音樣本進行語音轉文字的處理后,得到即時文字樣本數據,然后將即時文字樣本數據與語音驗證及采集模塊內存儲的標準文字樣本數據進行校驗對比,通過校驗對比的結果來確定是否采集該語音樣本。
2.根據權利要求1所述的一種基于驗證碼的語音數據樣本采集系統,其特征在于:所述語音驗證及采集模塊包括樣本采集服務器、樣本數據庫、呼叫終端和語音轉文字服務器,
所述用戶終端與樣本采集服務器連接,用于與樣本采集服務器進行信息交互并向樣本采集服務器發起驗證請求;所述用戶終端還與呼叫終端連接,用以接收呼叫終端發來的話路呼叫,并根據話路呼叫朗讀文字樣本數據,以向呼叫終端輸出文字樣本數據對應的語音樣本;
所述樣本采集服務器用以向用戶終端提供驗證服務;所述樣本采集服務器還與樣本數據庫連接,用于調取樣本數據庫中存儲的文字樣本數據;所述樣本采集服務器還與呼叫終端連接,用于控制呼叫終端向用戶終端發起呼叫驗證;
所述樣本數據庫與樣本采集服務器連接,用于向樣本采集服務器提供文字樣本的編號以及存儲識別的樣本標簽;所述樣本數據庫還與呼叫終端連接,用于存儲呼叫終端發來的語音樣本;
所述呼叫終端與樣本采集服務器連接,用于接收樣本采集服務器的呼叫控制請求;所述呼叫終端與用戶終端連接,用于向用戶終端發起呼叫;所述呼叫終端還與語音轉文字服務器連接,用于控制語音轉文字服務器將語音樣本轉成文字樣本;所述呼叫終端還與樣本數據庫連接,用于將語音樣本與文字樣本進行關聯存儲;
所述語音轉文字服務器與呼叫終端連接,用于響應來自呼叫終端的控制,以將語音樣本轉成文字樣本。
3.根據權利要求2所述的一種基于驗證碼的語音數據樣本采集系統,其特征在于:所述語音驗證及采集模塊還包括第三方平臺,所述第三方平臺與樣本采集服務器連接,用以接收樣本采集服務器對語音樣本的驗證結果;第三方平臺與用戶終端連接。
4.根據權利要求2所述的一種基于驗證碼的語音數據樣本采集系統,其特征在于:所述樣本數據庫將每一次識別成功的文字樣本按順序添加至語音采集樣本堆棧中,所述堆棧中存放經過樣本采集服務器校驗成功后的語音樣本數據。
5.根據權利要求1所述的一種基于驗證碼的語音數據樣本采集系統,其特征在于:所述數據樣本包括文字樣本數據和語音樣本數據。
6.一種基于驗證碼的語音數據樣本采集方法,其特征在于,包括如下步驟:
S1、樣本采集服務器為用戶與第三方平臺之間的信息互交提供驗證服務,用戶通過用戶終端向所述樣本采集服務器發送校驗請求;
S2、所述樣本采集服務器收到來自用戶終端的校驗請求后,向樣本數據庫中發送調取數據樣本數據的請求,得到樣本數據庫的響應后,獲得含有待識別的文字樣本數據;
S3、所述樣本采集服務器將步驟S2得到的文字樣本數據中的文字樣本和編號,作為數據樣本與存儲在所述樣本采集服務器內的有效校驗碼進行綁定整合后,對應生成一校驗碼,并將該校驗碼發送給用戶終端,同時提醒用戶接聽呼叫終端的電話呼叫,所述數據樣本包括數據樣本編號和文字樣本數據;
S4、所述樣本采集服務器向呼叫終端發起呼叫請求,并發送步驟S3得到的數據樣本編號;
S5、所述呼叫終端收到步驟S4發來的呼叫請求后,向用戶終端發起呼叫;
S6、用戶振鈴并摘機;
S7、所述呼叫終端向用戶終端播放朗讀文字樣本內容的語音提示;
S8、用戶聽到朗讀開始的語音提示音后,開始朗讀步驟S3中的文字樣本的文字內容,結束后掛機,生成與文字內容相對應的語音樣本;
S9、所述呼叫終端將步驟S8得到的語音樣本進行緩存,同時向語音轉文字服務器發送語音轉文字的請求;
S10、所述語音轉文字服務器將步驟S8得到的語音樣本進行語音轉文字處理,得到語音轉文字結果,所述語音轉文字結果為即時文字樣本,并將該即時文字樣本返回給呼叫終端;
S11、所述呼叫終端將即時文字樣本發送給所述樣本采集服務器進行結果比對;
S12、所述樣本采集服務器通過步驟S3得到的校驗碼將即時文字樣本與樣本采集服務器內存儲的標準文字樣本進行比對;
S13、若匹配成功,則向呼叫終端發送存儲語音樣本的請求,并向用戶終端反饋驗證成功的消息,同時向第三方平臺推送用戶驗證成功的通知,所述呼叫終端收到存入語音樣本的請求后,將語音樣本存入樣本數據庫的文字樣本對應的堆棧中;
S14、若匹配失敗,則向呼叫終端發送丟棄該語音樣本的指令,并向用戶終端發送驗證失敗的消息,同時向第三方平臺推送用戶驗證失敗的通知,呼叫終端收到丟棄語音樣本的通知后,將該語音樣本的數據清除。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國—東盟信息港股份有限公司,未經中國—東盟信息港股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910065909.8/1.html,轉載請聲明來源鉆瓜專利網。





