[發(fā)明專利]一種基于深度感知哈希的密文語音檢索方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010766576.4 | 申請日: | 2020-08-03 |
| 公開(公告)號: | CN111897909B | 公開(公告)日: | 2022-08-05 |
| 發(fā)明(設(shè)計)人: | 張秋余;白建;李昱州;趙雪嬌;許福久;趙振宇 | 申請(專利權(quán))人: | 蘭州理工大學(xué) |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/33;G06F21/60;G06N3/04;G06N3/08 |
| 代理公司: | 北京高沃律師事務(wù)所 11569 | 代理人: | 王立普 |
| 地址: | 730050 甘肅*** | 國省代碼: | 甘肅;62 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 感知 語音 檢索 方法 系統(tǒng) | ||
本發(fā)明涉及一種基于深度感知哈希的密文語音檢索方法及系統(tǒng)。該方法包括:根據(jù)原始語音庫,對原始語音文件進(jìn)行加密處理來構(gòu)建密文語音庫;根據(jù)所述原始語音庫,構(gòu)造原始語音文件的深度感知哈希序列,并生成系統(tǒng)哈希索引表;構(gòu)造待查詢語音的深度感知哈希序列;根據(jù)所述待查詢語音的深度感知哈希序列利用歸一化漢明距離算法在所述系統(tǒng)哈希索引表中進(jìn)行檢索匹配,得到檢索匹配結(jié)果;將所述檢索匹配結(jié)果進(jìn)行解密,并反饋給語音用戶。本發(fā)明能夠?qū)崿F(xiàn)密文語音的高效檢索。
技術(shù)領(lǐng)域
本發(fā)明涉及密文語音檢索領(lǐng)域,特別是涉及一種基于深度感知哈希的密文語音檢索方法及系統(tǒng)。
背景技術(shù)
隨著多媒體采集設(shè)備的日益普及和云存儲、互聯(lián)網(wǎng)等技術(shù)的飛速發(fā)展,存儲在云端的多媒體數(shù)據(jù)為用戶節(jié)省了本地空間,方便了不同客戶端之間的數(shù)據(jù)共享的同時,也帶來了查找困難、隱私泄露和數(shù)據(jù)不安全的問題。由于語音中包含大量機(jī)密信息,這使得語音信息在上傳云端之前進(jìn)行加密成為必然。由于語音數(shù)據(jù)加密后語音特征的巨大變化以及語音數(shù)據(jù)的不斷增長,給密文語音檢索增加了困難。因此,對密文語音檢索技術(shù)的研究獲得了眾多研究機(jī)構(gòu)和學(xué)者們的關(guān)注。
目前,現(xiàn)有基于內(nèi)容的密文語音檢索方法均是利用語音感知哈希技術(shù)提取語音的感知特征來實現(xiàn)。現(xiàn)有的語音特征提取方法在提取特征數(shù)量多時,效率明顯降低,且受限于魯棒性和區(qū)分性、摘要性和檢索效率的矛盾,并且基于感知哈希的密文語音檢索方法,不能滿足對海量語音數(shù)據(jù)的檢索需求,且索引的復(fù)雜度會隨著數(shù)據(jù)維數(shù)的增加而呈指數(shù)級增長,從而導(dǎo)致維度災(zāi)難問題。而語音特征提取是檢索過程的基礎(chǔ),特征表達(dá)的性能直接影響到后續(xù)的檢索效果。由于現(xiàn)有基于感知哈希的密文語音檢索方法都是利用已經(jīng)設(shè)計好的語音特征,對提取的特征進(jìn)行哈希構(gòu)造進(jìn)而生成二進(jìn)制哈希序列來實現(xiàn)語音檢索,而再重新設(shè)計適合密文語音檢索的語音特征時需要大量的先驗知識和實驗過程。另外,現(xiàn)有的基于感知哈希的密文語音檢索方法采用的語音長度均為4s-6s之間,增加語音長度后檢索精度和檢索效率均有所下降,因此本發(fā)明擬利用深度學(xué)習(xí)的方法來實現(xiàn)對較長的長語音(10s)進(jìn)行檢索。
目前,卷積神經(jīng)網(wǎng)絡(luò)(CNN,Convolutional Neural Network)是深度學(xué)習(xí)中發(fā)展最為深入的網(wǎng)絡(luò)結(jié)構(gòu)。由于CNN泛化能力強(qiáng),對于局部數(shù)據(jù)的挖掘能力特別強(qiáng),在人工智能領(lǐng)域的各個領(lǐng)域都取得了很好的效果。長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM,Long Short-Term MemoryNeural Network Model)不同于CNN,可以對時序數(shù)據(jù)進(jìn)行處理,實現(xiàn)對時間序列上的變化進(jìn)行建模。雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM,Bidirectional Long Short-Term Memory)是在LSTM神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上進(jìn)行改進(jìn)而形成的一種新的模型,可以解決由于傳輸時長增加導(dǎo)致的信息遺失程度明顯的問題。受深度學(xué)習(xí)技術(shù)的啟發(fā),深度哈希方法將深度網(wǎng)絡(luò)的輸出作為特征更加適合描述語義信息。同時,深度學(xué)習(xí)方法也被應(yīng)用于音頻領(lǐng)域以從音頻中捕捉復(fù)雜的特征。
另外,為了實現(xiàn)對云端語音數(shù)據(jù)的隱私保護(hù),語音加密方法是密文語音檢索系統(tǒng)中不可缺少的技術(shù)。現(xiàn)有的密文語音檢索方法使用的加密算法例如DES、AES、低維混沌等已不適用于多媒體數(shù)據(jù)的加密,而超混沌系統(tǒng)憑借對初始參數(shù)的敏感性、隨機(jī)性和遍歷性等特征被廣泛應(yīng)用于多媒體數(shù)據(jù)加密。
目前,卷積神經(jīng)網(wǎng)絡(luò)(CNN)只能提取局部特征,不能很好的對時序數(shù)據(jù)進(jìn)行處理。長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)雖然可以對時序數(shù)據(jù)進(jìn)行建模,但當(dāng)傳輸時長增加時會使信息遺失程度變得明顯。BiLSTM對每一個輸入序列正向和反向都經(jīng)過一次LSTM網(wǎng)絡(luò),但計算量大、處理時間長。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于深度感知哈希的密文語音檢索方法,能夠?qū)崿F(xiàn)密文語音的高效檢索。
為實現(xiàn)上述目的,本發(fā)明提供了如下方案:
一種基于深度感知哈希的密文語音檢索方法,包括:
根據(jù)原始語音庫,對原始語音文件進(jìn)行加密處理來構(gòu)建密文語音庫;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘭州理工大學(xué),未經(jīng)蘭州理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010766576.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:四足變身長滑行前進(jìn)機(jī)器人
- 下一篇:差速器
- 基于策略的業(yè)務(wù)感知模型及感知方法
- 一種基于分區(qū)感知的無線通信系統(tǒng)頻譜感知方法
- 確定空閑頻段的方法和系統(tǒng)、中心節(jié)點和感知節(jié)點
- 感知無線網(wǎng)絡(luò)的共享協(xié)作頻譜感知方法、感知節(jié)點和匯聚中心
- 感知無線網(wǎng)絡(luò)的協(xié)作頻譜感知方法和感知節(jié)點
- 頻譜感知方法、頻譜感知設(shè)備和數(shù)據(jù)庫
- 基于認(rèn)知數(shù)據(jù)庫和頻譜感知的頻譜共享方法及裝置
- 一種頂層感知限位組
- 一種自動駕駛汽車用升降式智能感知模塊
- 感知數(shù)據(jù)獲取方法和裝置





