[發(fā)明專(zhuān)利]語(yǔ)音檢測(cè)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202310089664.9 | 申請(qǐng)日: | 2023-02-09 |
| 公開(kāi)(公告)號(hào): | CN116168725A | 公開(kāi)(公告)日: | 2023-05-26 |
| 發(fā)明(設(shè)計(jì))人: | 王步云;吳澤策;楊睿 | 申請(qǐng)(專(zhuān)利權(quán))人: | 烽火通信科技股份有限公司 |
| 主分類(lèi)號(hào): | G10L25/51 | 分類(lèi)號(hào): | G10L25/51 |
| 代理公司: | 武漢智權(quán)專(zhuān)利代理事務(wù)所(特殊普通合伙) 42225 | 代理人: | 羅成 |
| 地址: | 430000 湖北省武*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音 檢測(cè) 方法 裝置 設(shè)備 可讀 存儲(chǔ) 介質(zhì) | ||
本發(fā)明提供一種語(yǔ)音檢測(cè)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì),語(yǔ)音檢測(cè)方法包括:對(duì)待檢測(cè)語(yǔ)音進(jìn)行人聲和背景噪聲分離,得到待檢測(cè)人聲和待檢測(cè)背景噪聲;通過(guò)計(jì)算待檢測(cè)背景噪聲的第一特征和真實(shí)背景噪聲的第一特征之間的相似度,判定待檢測(cè)背景噪聲是否真實(shí);若待檢測(cè)背景噪聲為不真實(shí),則判定待檢測(cè)語(yǔ)音不是真人語(yǔ)音;若待檢測(cè)背景噪聲為真實(shí),則通過(guò)計(jì)算待檢測(cè)人聲的第二特征和真實(shí)目標(biāo)人聲的第二特征之間的相似度,判定待檢測(cè)語(yǔ)音是否為真人語(yǔ)音。本發(fā)明通過(guò),將待檢測(cè)語(yǔ)音分離得到的待檢測(cè)背景噪聲和真實(shí)背景噪聲進(jìn)行特征提取及相似度對(duì)比,由于真實(shí)背景噪聲難以獲取及模仿,因此能夠有效提升語(yǔ)音檢測(cè)的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音檢測(cè)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
日常生活中,經(jīng)常接到偽裝人的聲音的營(yíng)銷(xiāo)、詐騙電話(huà),這些通過(guò)計(jì)算機(jī)AI(ArtificialIntelligence,人工智能)自動(dòng)生成的語(yǔ)音電話(huà)非常接近真人語(yǔ)音,缺少經(jīng)驗(yàn)的人很容易受欺騙,從而導(dǎo)致經(jīng)濟(jì)損失,以及一些采用語(yǔ)音合成技術(shù)或者拼接真人聲音生成的語(yǔ)音,通過(guò)聊天工具向其親戚朋友發(fā)送語(yǔ)音借錢(qián)而導(dǎo)致財(cái)產(chǎn)損失,現(xiàn)有帶語(yǔ)音智能的軟件可以高度模仿真人的語(yǔ)音特征或者通過(guò)拼接真實(shí)人聲生成語(yǔ)音,普通人很難分辨真假,一不小心就會(huì)中招成為被害人。
目前,通常是通過(guò)建立聲紋模型來(lái)識(shí)別是否為同一人,但是由于AI軟件可以高度模仿真人的語(yǔ)音特征,導(dǎo)致通過(guò)分析真人與錄音文件的語(yǔ)音特征相似程度,進(jìn)行真?zhèn)卧u(píng)判的準(zhǔn)確率不高,另外,通過(guò)聊天工具及錄音軟件等,可以獲取到真人的語(yǔ)音,通過(guò)拼接語(yǔ)音的方式也可以偽造一段真人語(yǔ)音,難以分辨出真假,因此,目前這種建立在聲紋識(shí)別技術(shù)基礎(chǔ)上的語(yǔ)音檢測(cè)方法,對(duì)于一些AI軟件的模仿語(yǔ)音和真人語(yǔ)音拼接的情形,很難有效辨別真?zhèn)巍?/p>
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種語(yǔ)音檢測(cè)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì),旨在解決目前建立在聲紋識(shí)別技術(shù)基礎(chǔ)上的語(yǔ)音檢測(cè)方法,對(duì)于一些AI軟件的模仿語(yǔ)音和真人語(yǔ)音拼接的情形,很難有效辨別真?zhèn)蔚募夹g(shù)問(wèn)題。
第一方面,本發(fā)明提供一種語(yǔ)音檢測(cè)方法,所述語(yǔ)音檢測(cè)方法包括:
獲取待檢測(cè)語(yǔ)音、真實(shí)目標(biāo)人聲和真實(shí)背景噪聲;
對(duì)待檢測(cè)語(yǔ)音進(jìn)行人聲和背景噪聲分離,得到待檢測(cè)人聲和待檢測(cè)背景噪聲;
從待檢測(cè)背景噪聲和真實(shí)背景噪聲中,分別提取第一特征,通過(guò)計(jì)算待檢測(cè)背景噪聲的第一特征和真實(shí)背景噪聲的第一特征之間的相似度,判定待檢測(cè)背景噪聲是否真實(shí);
若待檢測(cè)背景噪聲為不真實(shí),則判定待檢測(cè)語(yǔ)音不是真人語(yǔ)音;
若待檢測(cè)背景噪聲為真實(shí),則從待檢測(cè)人聲和真實(shí)目標(biāo)人聲中,分別提取第二特征,通過(guò)計(jì)算待檢測(cè)人聲的第二特征和真實(shí)目標(biāo)人聲的第二特征之間的相似度,判定待檢測(cè)語(yǔ)音是否為真人語(yǔ)音。
可選的,所述對(duì)待檢測(cè)語(yǔ)音進(jìn)行人聲和背景噪聲分離,得到待檢測(cè)人聲和待檢測(cè)背景噪聲包括:
將待檢測(cè)語(yǔ)音劃分為連續(xù)且時(shí)長(zhǎng)相等的多個(gè)語(yǔ)音幀;
將每一個(gè)語(yǔ)音幀使用傅里葉變換轉(zhuǎn)換為頻域,將每一個(gè)語(yǔ)音幀根據(jù)頻域劃分為多個(gè)頻率區(qū)間;
根據(jù)每個(gè)頻率區(qū)間的能量值和每個(gè)頻率區(qū)間的預(yù)設(shè)能量值,采用概率計(jì)算模型,判定每一個(gè)語(yǔ)音幀是否為人聲;
將判定為人聲,且時(shí)間上連續(xù)的語(yǔ)音幀進(jìn)行合并,將合并得到的一個(gè)或多個(gè)片段作為待檢測(cè)人聲;
將判定為不是人聲,且時(shí)間上連續(xù)的語(yǔ)音幀進(jìn)行合并,將合并得到的一個(gè)或多個(gè)片段作為待檢測(cè)背景噪聲。
可選的,所述從待檢測(cè)背景噪聲和真實(shí)背景噪聲中,分別提取第一特征,通過(guò)計(jì)算待檢測(cè)背景噪聲的第一特征和真實(shí)背景噪聲的第一特征之間的相似度,判定待檢測(cè)背景噪聲是否真實(shí)包括:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于烽火通信科技股份有限公司,未經(jīng)烽火通信科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310089664.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





