[發(fā)明專利]基于可信呼叫的實時音視頻流的智能語音識別技術(shù)在審
| 申請?zhí)枺?/td> | 202110422256.1 | 申請日: | 2021-04-20 |
| 公開(公告)號: | CN113140211A | 公開(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計)人: | 劉波濤 | 申請(專利權(quán))人: | 武漢微物云聯(lián)科技有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/26;G10L17/00;H04W4/16;H04W12/02;H04W12/03 |
| 代理公司: | 武漢高得專利代理事務(wù)所(普通合伙) 42268 | 代理人: | 姜璐 |
| 地址: | 430084 湖北省武漢市東湖新技*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 可信 呼叫 實時 視頻 智能 語音 識別 技術(shù) | ||
本發(fā)明公開了基于可信呼叫的實時音視頻流的智能語音識別技術(shù),包括前準(zhǔn)備模塊、模式匹配模塊、呼叫端和接聽端,所述前準(zhǔn)備模塊包括可信呼叫來源數(shù)據(jù)庫、聲紋數(shù)據(jù)庫和聲紋綁定模塊,所述呼叫端與接聽端之間依次通過信息傳輸模塊、語音輸入模塊、語音提取模塊、模式匹配模塊、語音檢測模塊、語音對比模塊和語音識別模塊連接,所述呼叫端和接聽端整個流程之間均設(shè)置在加密模塊的包圍中。該基于可信呼叫的實時音視頻流的智能語音識別技術(shù)通過前準(zhǔn)備模塊的聲紋綁定模塊有效保護(hù)接聽和呼入人員的隱私,在使用前需要先錄入聲紋綁定用戶,用戶注冊登錄后,錄入兩次聲紋,兩次檢測相同即為綁定成功,成功添加用戶聲紋才可以使用。
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,尤指基于可信呼叫的實時音視頻流的智能語音識別技術(shù)。
背景技術(shù)
隨著科技的發(fā)展,人們可以實時的通過手機電腦等電子設(shè)備溝通,但對那些聽力嚴(yán)重障礙的人來說卻并非如此,雖然現(xiàn)在在世界上很多國家都有語音轉(zhuǎn)換服務(wù),通過媒介來讓聽力障礙人士交流,但這在保護(hù)用戶隱私方面尚有不足,另外從設(shè)備、訓(xùn)練到勞動力投入,其費用較昂貴。 而且某些特定的服務(wù)號碼,僅為某幾個重要人物服務(wù)。因為這樣的場景中,通話內(nèi)容非常重要,而通過技術(shù)手段偽造電話號碼發(fā)起呼叫并不困難,因此依靠號碼來源不能判斷是否是這些重要人物發(fā)起的呼叫。因此,接聽和呼入人員的隱私和通話安全缺少了保障。
發(fā)明內(nèi)容
鑒于以上問題,本發(fā)明提供基于可信呼叫的實時音視頻流的智能語音識別技術(shù)來解決上述背景技術(shù)中提出的問題。具體如下: 為達(dá)到上述目的,本發(fā)明采用如下技術(shù)方案:基于可信呼叫的實時音視頻流的智能語音識別技術(shù),包括前準(zhǔn)備模塊、信息傳輸模塊、語音輸入模塊、語音提取模塊、模式匹配模塊、呼叫端和接聽端,所述前準(zhǔn)備模塊包括可信呼叫來源數(shù)據(jù)庫、聲紋數(shù)據(jù)庫和聲紋綁定模塊,所述呼叫端與接聽端之間依次通過信息傳輸模塊、語音輸入模塊、語音提取模塊、模式匹配模塊、語音檢測模塊、語音對比模塊和語音識別模塊連接,所述呼叫端和接聽端整個流程之間均設(shè)置在加密模塊的包圍中,所述信息傳輸模塊、語音輸入模塊、語音提取模塊、模式匹配模塊、語音檢測模塊、語音對比模塊、語音保存模塊和語音識別模塊之間互相通過電性連接。 優(yōu)選的,所述聲紋綁定模塊包括用戶注冊、用戶登錄和用戶檢測,且聲紋綁定模塊設(shè)置有兩次錄音綁定。 優(yōu)選的,所述前準(zhǔn)備模塊分別與加密模塊連接和語音保存模塊電性連接,所述前準(zhǔn)備模塊設(shè)置有密鑰。 優(yōu)選的,所述語音提取模塊與語音保存模塊電性直接連接,且語音保存模塊通過電性與語音對比模塊直接連接。 優(yōu)選的,所述語音檢測模塊分別與語音提醒模塊和語音反饋模塊電性連接,所述語音提醒模塊設(shè)置為音頻提醒和彈窗提醒兩種方式,所述語音反饋模塊與可信呼叫來源數(shù)據(jù)庫連接。 優(yōu)選的,所述語音識別模塊與語音轉(zhuǎn)換模塊連接,且語音轉(zhuǎn)換模塊包括文字轉(zhuǎn)換、信號轉(zhuǎn)換和語種轉(zhuǎn)換。 優(yōu)選的,包括以下流程: S1、在使用啟動系統(tǒng)之前,需要先錄入聲紋綁定用戶,用戶注冊登錄后,錄入兩次聲紋,兩次檢測相同即為綁定成功,成功添加用戶聲紋即可使用; S2、呼叫端在信號加密的前提下,通過信息傳輸模塊將信號傳遞給語音輸入模塊,再由語音輸入模塊將信號傳遞給語音提取模塊,將提取的聲紋信息依次傳給模式匹配模塊、語音檢測模塊和語音對比模塊進(jìn)行對比配匹配,再經(jīng)過語音識別模塊與信息傳輸模塊將信息傳遞給接聽端; S3、當(dāng)語音檢測模塊檢測到聲紋與可信呼叫來源數(shù)據(jù)庫聲紋不同時,語音提醒模塊進(jìn)行音頻提醒和彈窗提醒; S4、當(dāng)語音反饋模塊將信息反饋給可信呼叫來源數(shù)據(jù)庫,并發(fā)現(xiàn)聲紋信息不符,提醒接聽端的同時,反饋給實際真正的呼叫端。 本發(fā)明具有以下有益效果:該基于可信呼叫的實時音視頻流的智能語音識別技術(shù)通過前準(zhǔn)備模塊的聲紋綁定模塊有效保護(hù)接聽和呼入人員的隱私,在使用前需要先錄入聲紋綁定用戶,用戶注冊登錄后,錄入兩次聲紋,兩次檢測相同即為綁定成功,成功添加用戶聲紋才可以使用;而且前準(zhǔn)備模塊與加密模塊電性連接,同時前準(zhǔn)備模塊設(shè)置有密鑰,呼叫端和接聽端整個流程之間均設(shè)置在加密模塊的包圍中,進(jìn)一步提高了接聽和呼入人員的隱私和通話安全;另外,語音識別模塊與語音轉(zhuǎn)換模塊連接,且語音轉(zhuǎn)換模塊包括文字轉(zhuǎn)換、信號轉(zhuǎn)換和語種轉(zhuǎn)換,對于聽力有障礙的使用者來說,可以將語音轉(zhuǎn)換成文字來識別,并且可以根據(jù)語種來進(jìn)行轉(zhuǎn)換。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢微物云聯(lián)科技有限公司,未經(jīng)武漢微物云聯(lián)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110422256.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





