[發(fā)明專利]基于可信呼叫的實時音視頻流的智能語音識別技術(shù)在審

申請?zhí)枺?/td>	202110422256.1	申請日：	2021-04-20
公開（公告）號：	CN113140211A	公開（公告）日：	2021-07-20
發(fā)明（設(shè)計）人：	劉波濤	申請（專利權(quán)）人：	武漢微物云聯(lián)科技有限公司
主分類號：	G10L15/00	分類號：	G10L15/00;G10L15/26;G10L17/00;H04W4/16;H04W12/02;H04W12/03
代理公司：	武漢高得專利代理事務(wù)所(普通合伙) 42268	代理人：	姜璐
地址：	430084 湖北省武漢市東湖新技***	國省代碼：	湖北;42
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于可信呼叫實時視頻智能語音識別技術(shù)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了基于可信呼叫的實時音視頻流的智能語音識別技術(shù)，包括前準(zhǔn)備模塊、模式匹配模塊、呼叫端和接聽端，所述前準(zhǔn)備模塊包括可信呼叫來源數(shù)據(jù)庫、聲紋數(shù)據(jù)庫和聲紋綁定模塊，所述呼叫端與接聽端之間依次通過信息傳輸模塊、語音輸入模塊、語音提取模塊、模式匹配模塊、語音檢測模塊、語音對比模塊和語音識別模塊連接，所述呼叫端和接聽端整個流程之間均設(shè)置在加密模塊的包圍中。該基于可信呼叫的實時音視頻流的智能語音識別技術(shù)通過前準(zhǔn)備模塊的聲紋綁定模塊有效保護(hù)接聽和呼入人員的隱私，在使用前需要先錄入聲紋綁定用戶，用戶注冊登錄后，錄入兩次聲紋，兩次檢測相同即為綁定成功，成功添加用戶聲紋才可以使用。

技術(shù)領(lǐng)域

本發(fā)明涉及語音識別技術(shù)領(lǐng)域，尤指基于可信呼叫的實時音視頻流的智能語音識別技術(shù)。

背景技術(shù)

隨著科技的發(fā)展，人們可以實時的通過手機電腦等電子設(shè)備溝通，但對那些聽力嚴(yán)重障礙的人來說卻并非如此，雖然現(xiàn)在在世界上很多國家都有語音轉(zhuǎn)換服務(wù)，通過媒介來讓聽力障礙人士交流，但這在保護(hù)用戶隱私方面尚有不足，另外從設(shè)備、訓(xùn)練到勞動力投入，其費用較昂貴。而且某些特定的服務(wù)號碼，僅為某幾個重要人物服務(wù)。因為這樣的場景中，通話內(nèi)容非常重要，而通過技術(shù)手段偽造電話號碼發(fā)起呼叫并不困難，因此依靠號碼來源不能判斷是否是這些重要人物發(fā)起的呼叫。因此，接聽和呼入人員的隱私和通話安全缺少了保障。

發(fā)明內(nèi)容

鑒于以上問題，本發(fā)明提供基于可信呼叫的實時音視頻流的智能語音識別技術(shù)來解決上述背景技術(shù)中提出的問題。具體如下：為達(dá)到上述目的，本發(fā)明采用如下技術(shù)方案：基于可信呼叫的實時音視頻流的智能語音識別技術(shù)，包括前準(zhǔn)備模塊、信息傳輸模塊、語音輸入模塊、語音提取模塊、模式匹配模塊、呼叫端和接聽端，所述前準(zhǔn)備模塊包括可信呼叫來源數(shù)據(jù)庫、聲紋數(shù)據(jù)庫和聲紋綁定模塊，所述呼叫端與接聽端之間依次通過信息傳輸模塊、語音輸入模塊、語音提取模塊、模式匹配模塊、語音檢測模塊、語音對比模塊和語音識別模塊連接，所述呼叫端和接聽端整個流程之間均設(shè)置在加密模塊的包圍中，所述信息傳輸模塊、語音輸入模塊、語音提取模塊、模式匹配模塊、語音檢測模塊、語音對比模塊、語音保存模塊和語音識別模塊之間互相通過電性連接。優(yōu)選的，所述聲紋綁定模塊包括用戶注冊、用戶登錄和用戶檢測，且聲紋綁定模塊設(shè)置有兩次錄音綁定。優(yōu)選的，所述前準(zhǔn)備模塊分別與加密模塊連接和語音保存模塊電性連接，所述前準(zhǔn)備模塊設(shè)置有密鑰。優(yōu)選的，所述語音提取模塊與語音保存模塊電性直接連接，且語音保存模塊通過電性與語音對比模塊直接連接。優(yōu)選的，所述語音檢測模塊分別與語音提醒模塊和語音反饋模塊電性連接，所述語音提醒模塊設(shè)置為音頻提醒和彈窗提醒兩種方式，所述語音反饋模塊與可信呼叫來源數(shù)據(jù)庫連接。優(yōu)選的，所述語音識別模塊與語音轉(zhuǎn)換模塊連接，且語音轉(zhuǎn)換模塊包括文字轉(zhuǎn)換、信號轉(zhuǎn)換和語種轉(zhuǎn)換。優(yōu)選的，包括以下流程： S1、在使用啟動系統(tǒng)之前，需要先錄入聲紋綁定用戶，用戶注冊登錄后，錄入兩次聲紋，兩次檢測相同即為綁定成功，成功添加用戶聲紋即可使用； S2、呼叫端在信號加密的前提下，通過信息傳輸模塊將信號傳遞給語音輸入模塊，再由語音輸入模塊將信號傳遞給語音提取模塊，將提取的聲紋信息依次傳給模式匹配模塊、語音檢測模塊和語音對比模塊進(jìn)行對比配匹配，再經(jīng)過語音識別模塊與信息傳輸模塊將信息傳遞給接聽端； S3、當(dāng)語音檢測模塊檢測到聲紋與可信呼叫來源數(shù)據(jù)庫聲紋不同時，語音提醒模塊進(jìn)行音頻提醒和彈窗提醒； S4、當(dāng)語音反饋模塊將信息反饋給可信呼叫來源數(shù)據(jù)庫，并發(fā)現(xiàn)聲紋信息不符，提醒接聽端的同時，反饋給實際真正的呼叫端。本發(fā)明具有以下有益效果：該基于可信呼叫的實時音視頻流的智能語音識別技術(shù)通過前準(zhǔn)備模塊的聲紋綁定模塊有效保護(hù)接聽和呼入人員的隱私，在使用前需要先錄入聲紋綁定用戶，用戶注冊登錄后，錄入兩次聲紋，兩次檢測相同即為綁定成功，成功添加用戶聲紋才可以使用；而且前準(zhǔn)備模塊與加密模塊電性連接，同時前準(zhǔn)備模塊設(shè)置有密鑰，呼叫端和接聽端整個流程之間均設(shè)置在加密模塊的包圍中，進(jìn)一步提高了接聽和呼入人員的隱私和通話安全；另外，語音識別模塊與語音轉(zhuǎn)換模塊連接，且語音轉(zhuǎn)換模塊包括文字轉(zhuǎn)換、信號轉(zhuǎn)換和語種轉(zhuǎn)換，對于聽力有障礙的使用者來說，可以將語音轉(zhuǎn)換成文字來識別，并且可以根據(jù)語種來進(jìn)行轉(zhuǎn)換。

附圖說明

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢微物云聯(lián)科技有限公司，未經(jīng)武漢微物云聯(lián)科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110422256.1/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：多模塊快速互換式農(nóng)田作業(yè)裝備
下一篇：一種高密度抗氧化鎳銅合金的制備方法

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】