[發(fā)明專利]一種詐騙電話語音自動(dòng)標(biāo)注系統(tǒng)及方法在審
| 申請(qǐng)?zhí)枺?/td> | 201811304612.4 | 申請(qǐng)日: | 2018-11-04 |
| 公開(公告)號(hào): | CN109493882A | 公開(公告)日: | 2019-03-19 |
| 發(fā)明(設(shè)計(jì))人: | 張震;李鵬;黃遠(yuǎn);高圣翔;杜裕琴;倪江帆 | 申請(qǐng)(專利權(quán))人: | 國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;訊飛智元信息科技有限公司 |
| 主分類號(hào): | G10L25/51 | 分類號(hào): | G10L25/51;G10L17/00;G10L15/26;H04M3/22 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100020*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 標(biāo)注 維度 連續(xù)語音 詐騙電話 自動(dòng)標(biāo)注 聲紋 智能語音 語音 標(biāo)簽 通話語音數(shù)據(jù) 電話詐騙 技術(shù)實(shí)現(xiàn) 加密傳輸 目標(biāo)數(shù)據(jù) 輸入語音 語音數(shù)據(jù) 自動(dòng)處理 自動(dòng)分析 輸出端 輸入端 有效地 場(chǎng)景 應(yīng)用 優(yōu)化 保證 管理 | ||
1.一種詐騙電話語音自動(dòng)標(biāo)注系統(tǒng),其特征在于,包括基礎(chǔ)維度標(biāo)注模塊、聲紋標(biāo)注模塊、連續(xù)語音識(shí)別標(biāo)注模塊,所述基礎(chǔ)維度標(biāo)注模塊的輸出端分別與所述聲紋標(biāo)注模塊的輸入端、所述連續(xù)語音識(shí)別標(biāo)注模塊的輸入端相連接。
2.根據(jù)權(quán)利要求1所述的一種詐騙電話語音自動(dòng)標(biāo)注系統(tǒng),其特征在于,所述基礎(chǔ)維度標(biāo)注模塊包括基礎(chǔ)維度語音預(yù)處理模塊、語種識(shí)別模塊、基礎(chǔ)維度假音識(shí)別模塊、男女聲識(shí)別模塊,所述基礎(chǔ)維度語音預(yù)處理模塊與所述語種識(shí)別模塊相連接,所述語種識(shí)別模塊與所述基礎(chǔ)維度假音識(shí)別模塊相連接,所述基礎(chǔ)維度假音識(shí)別模塊與所述男女聲識(shí)別模塊相連接。
3.根據(jù)權(quán)利要求2所述的一種詐騙電話語音自動(dòng)標(biāo)注系統(tǒng),其特征在于,所述基礎(chǔ)維度語音預(yù)處理模塊用于將針對(duì)自然語音識(shí)別分析、詐騙文本發(fā)現(xiàn)和語音內(nèi)容深度分析的應(yīng)用需求,提供電話信道語音數(shù)據(jù)中的話音活動(dòng)檢測(cè)、彩鈴檢測(cè)、無效音檢測(cè)和有效語音檢測(cè)功能;所述語種識(shí)別模塊用于通過提取通話語音的核心特征,并進(jìn)行模型比對(duì)以及得分判決,以提供通話語音的語種識(shí)別服務(wù);所述基礎(chǔ)維度假音識(shí)別模塊用于對(duì)合成音模板數(shù)據(jù)進(jìn)行快速精準(zhǔn)識(shí)別;所述男女聲識(shí)別模塊用于根據(jù)對(duì)詐騙電話特征的分析,同步使用男女聲識(shí)別技術(shù),根據(jù)男聲和女聲由于生理發(fā)音器官的不同而引起的頻譜差異,來對(duì)語音發(fā)聲者進(jìn)行性別判斷。
4.根據(jù)權(quán)利要求1所述的一種詐騙電話語音自動(dòng)標(biāo)注系統(tǒng),其特征在于,所述連續(xù)語音識(shí)別標(biāo)注模塊包括連續(xù)語音預(yù)處理模塊、連續(xù)語音識(shí)別模塊,所述連續(xù)語音預(yù)處理模塊的輸出端與所述連續(xù)語音識(shí)別模塊的輸入端相連接;所述連續(xù)語音預(yù)處理模塊用來接收輸入目標(biāo)語音后,將根據(jù)語音中的能量分布,進(jìn)行語音片段的切分,作為后續(xù)輸入所述連續(xù)語音識(shí)別模塊處理的數(shù)據(jù)集合;所述連續(xù)語音識(shí)別模塊用來提供底層的連續(xù)語音識(shí)別引擎,將輸入的每條語音片段的內(nèi)容進(jìn)行有效處理并輸出對(duì)應(yīng)的文本內(nèi)容。
5.根據(jù)權(quán)利要求1所述的一種詐騙電話語音自動(dòng)標(biāo)注系統(tǒng),其特征在于,所述聲紋語音預(yù)處理模塊、聲紋聚類模塊、聲紋假音識(shí)別模塊,所述聲紋語音預(yù)處理模塊的輸出端與所述聲紋聚類模塊的輸入端相連接,所述聲紋聚類模塊的輸出端與所述聲紋假音識(shí)別模塊的輸入端相連接;所述聲紋語音預(yù)處理模塊的輸入端輸入被所述基礎(chǔ)維度標(biāo)注模塊確認(rèn)為詐騙語音的語音數(shù)據(jù);所述聲紋語音預(yù)處理模塊用來在輸入詐騙語音后,引擎將根據(jù)所述詐騙語音所含的說話人信息,進(jìn)行說話人分離,并將進(jìn)行無效語音的過濾并對(duì)有效語音內(nèi)容進(jìn)行語音增強(qiáng);所述聲紋假音識(shí)別模塊用以對(duì)識(shí)別出來的每一個(gè)說話人語音片段進(jìn)行是否合成音判斷,便于快速對(duì)合成音數(shù)據(jù)以及說話人語音進(jìn)行有效區(qū)分。
6.根據(jù)權(quán)利要求5所述的一種詐騙電話語音自動(dòng)標(biāo)注系統(tǒng),其特征在于,所述聲紋聚類模塊包括有效性檢測(cè)模塊、聲紋自動(dòng)注冊(cè)模塊、聲紋同一性比較模塊,所述有效性檢測(cè)模塊用來從備選數(shù)據(jù)中挑選語音長度符合要求的語音數(shù)據(jù),進(jìn)一步通過去鈴音、話音檢出、話音質(zhì)量檢測(cè)技術(shù)從備選語音中篩選出符合自動(dòng)注冊(cè)標(biāo)準(zhǔn)的語音數(shù)據(jù);所述聲紋自動(dòng)注冊(cè)模塊用來對(duì)通過有效性檢測(cè)的語音數(shù)據(jù)采用自動(dòng)標(biāo)注技術(shù)完成當(dāng)前數(shù)據(jù)的對(duì)應(yīng)聲紋注冊(cè);所述聲紋同一性比較模塊用來將最新注冊(cè)的聲紋與已注冊(cè)的歷史聲紋庫進(jìn)行比較,如果相似度大于閾值,則認(rèn)為歷史聲紋庫中當(dāng)前聲紋沒有變化,采用新注冊(cè)聲紋更新原有聲紋特征;否則,進(jìn)行聲紋變更檢測(cè)。
7.一種基于權(quán)利要求1所述的詐騙電話語音自動(dòng)標(biāo)注方法,其特征在于,具體包括如下步驟:
步驟SS1:基礎(chǔ)維度標(biāo)注步驟;
步驟SS2:連續(xù)語音識(shí)別步驟;
步驟SS3:聲紋標(biāo)注步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;訊飛智元信息科技有限公司,未經(jīng)國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;訊飛智元信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811304612.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 標(biāo)注信息生成裝置、查詢裝置及共享系統(tǒng)
- 一種圖像分割標(biāo)注方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)標(biāo)注方法
- 一種基于群智的語料庫數(shù)據(jù)標(biāo)注方法及系統(tǒng)
- 一種圖像標(biāo)注方法和裝置
- 一種樣本標(biāo)注方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 數(shù)據(jù)標(biāo)注管理方法及裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 標(biāo)注的更新方法、裝置、存儲(chǔ)介質(zhì)、處理器以及運(yùn)載工具
- 數(shù)據(jù)的標(biāo)注方法和裝置
- 一種智能標(biāo)注平臺(tái)的方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種基于維度組合的指標(biāo)計(jì)算方法和系統(tǒng)
- 多媒體數(shù)據(jù)定價(jià)處理方法及裝置
- 多媒體數(shù)據(jù)定價(jià)系統(tǒng)
- 聚合表維度的選擇方法和裝置
- 指標(biāo)異動(dòng)分析方法及設(shè)備、計(jì)算機(jī)存儲(chǔ)介質(zhì)、計(jì)算機(jī)設(shè)備
- 多維度數(shù)據(jù)的數(shù)據(jù)分析方法、裝置及存儲(chǔ)介質(zhì)
- 廣告流量預(yù)估方法和裝置
- 數(shù)據(jù)融合方法、數(shù)據(jù)融合裝置及存儲(chǔ)介質(zhì)
- 報(bào)表生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 數(shù)據(jù)倉庫維度表的校驗(yàn)方法及裝置
- 標(biāo)識(shí)語音呼叫連續(xù)性(VCC)訂戶的系統(tǒng)和方法
- 連續(xù)語音識(shí)別方法及系統(tǒng)
- 連續(xù)長語音文件的翻譯方法與翻譯機(jī)
- 連續(xù)語音識(shí)別方法及系統(tǒng)
- 語音識(shí)別連續(xù)性控制方法、裝置、智能終端及存儲(chǔ)介質(zhì)
- 連續(xù)交互控制方法和裝置
- 語音喚醒處理方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 語音長時(shí)間連續(xù)丟包補(bǔ)償方法和裝置
- 頻道控制方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 用于識(shí)別連續(xù)和分立語音的語音識(shí)別系統(tǒng)





