[發(fā)明專利]一種云存儲環(huán)境下中文語音密文存儲、檢索方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011138829.X | 申請日: | 2020-10-22 |
| 公開(公告)號: | CN112233666A | 公開(公告)日: | 2021-01-15 |
| 發(fā)明(設(shè)計)人: | 陳馳;韋馨蕾;田雪;王佳寧;蘇帥 | 申請(專利權(quán))人: | 中國科學院信息工程研究所 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/14;G10L15/183;G10L15/22;G10L15/26;H04L9/06;H04L29/06;H04L29/08;G06F16/683 |
| 代理公司: | 北京君尚知識產(chǎn)權(quán)代理有限公司 11200 | 代理人: | 余長江 |
| 地址: | 100093 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 存儲 環(huán)境 中文 語音 文存 檢索 方法 系統(tǒng) | ||
本發(fā)明提供一種云存儲環(huán)境下中文語音密文存儲、檢索方法及系統(tǒng),包括:用戶端,用以生成語音文件;生成查詢關(guān)鍵字;解密密文數(shù)據(jù),得到音頻文件;服務端,用以接收并識別語音文件,生成識別文本文件;獲取識別文本文件的關(guān)鍵字,并對語音文件與關(guān)鍵字加密,將生成的密文數(shù)據(jù)及密文索引上傳至云服務器端;接收查詢關(guān)鍵字并加密;根據(jù)加密結(jié)果,生成查詢請求并發(fā)送至云服務端;接收云服務端發(fā)送的密文數(shù)據(jù)并返回至客戶端;云服務端,用以存儲語音文件的密文數(shù)據(jù)及密文索引;通過密文查詢請求及密文索引,獲取密文數(shù)據(jù)。本發(fā)明可以通過文本關(guān)鍵字對語音的內(nèi)容進行檢索,能夠?qū)φZ音文件進行密文檢索。
技術(shù)領(lǐng)域
本發(fā)明涉及信息安全領(lǐng)域,具體地說,涉及一種云存儲環(huán)境下中文語音密文存儲、檢索方法及系統(tǒng)。
背景技術(shù)
云計算技術(shù)以及大數(shù)據(jù)存儲技術(shù)的發(fā)展優(yōu)化了傳統(tǒng)的數(shù)據(jù)存儲,通過虛擬化和分布式計算與存儲技術(shù),云存儲將多個存儲介質(zhì)整合為統(tǒng)一的存儲資源池,向用戶提供存儲服務,用戶不再需要自行購買硬件,只需要簡單地操作就能將數(shù)據(jù)存儲到云端。由于云存儲的便捷與經(jīng)濟,許多企業(yè)與個人將數(shù)據(jù)上傳到云端交由第三方云服務商保存。然而,在云計算環(huán)境下,數(shù)據(jù)管理權(quán)從數(shù)據(jù)所有者轉(zhuǎn)移到了第三方云服務商,云存儲在給企業(yè)與個人的數(shù)據(jù)管理帶來便利的同時,也帶來了極大的安全隱患。根據(jù)云安全聯(lián)盟(CSA)在2016年公布的云計算面臨的十二大安全威脅中,數(shù)據(jù)泄露排在了第一位。數(shù)據(jù)泄露會帶來隱私泄露的問題,極大地威脅了云存儲中企業(yè)以及個人數(shù)據(jù)的機密性。為了保證云存儲中數(shù)據(jù)的機密性,可以采取密文存儲的方式,先對文件進行加密,再將密文文件存儲到云端。然而,云計算中存在著海量的數(shù)據(jù),如何快速查找到這些密文數(shù)據(jù)成為了一個難題。為了解決這一問題,出現(xiàn)了密文檢索技術(shù),然而大部分的密文檢索技術(shù)僅僅針對文本文件進行檢索。在云存儲中,除了文本類型的文件,還存在著大量的其他類型的文件,語音類型的文件(如會議錄音、通話記錄等)也是云存儲中常見的文件類型。因此,如何對語音內(nèi)容進行快速、準確以及高效的密文檢索成為了迫切需要解決的問題。
已公開的專利申請CN201910500492.3提供了一種語音檢索方法及系統(tǒng)。該方法借鑒生物哈希技術(shù),對原始語音進行特征提取,獲取原始語音的第一哈希序列,將第一哈希序列作為檢索摘要,通過比較第一哈希序列和查詢語音的第二哈希序列的漢明距離,完成檢索內(nèi)容的匹配。該方法通過采用生物哈希技術(shù)提取語音的哈希摘要,提高了語音哈希摘要的安全性,但是該方法只能通過語音檢索到相似的語音文件,不能通過文本關(guān)鍵字對語音內(nèi)包含的信息進行檢索。
已公開的專利申請CN201910019614.7基于音頻濃縮摘要的海量音頻檢索方法,提供了一種基于音頻濃縮摘要的海量音頻檢索方法。包括如下步驟:選擇文件夾,生成多線程執(zhí)行濃縮任務,打開待濃縮的文件,讀取音頻幀并解碼,得到裸的PCM數(shù)據(jù),使用VAD算法對PCM裸數(shù)據(jù)進行判定,并進行語音識別生成摘要信息和音頻索引文件,提供音頻的檢索和播放功能。通過使用多線程并行方式對海量音頻數(shù)據(jù)所在的文件夾進行濃縮,提取出有價值的語音和文字信息,并生成包含摘要信息的音頻索引文件,用戶可輸入文本關(guān)鍵字進行快速檢索,大大提高了工作效率。然而,該方法對語音文件的摘要和檢索主要在明文狀態(tài)下進行,在云存儲環(huán)境下難以保證安全性。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中存在的技術(shù)問題,本發(fā)明的目的在于提供一種云存儲環(huán)境下中文語音密文存儲、檢索方法及系統(tǒng),主要思想是通過中文語音識別生成語音內(nèi)容的文字信息,并生成包含語音內(nèi)容的密文索引,最終通過密文檢索接口,利用文本關(guān)鍵詞實現(xiàn)對加密的語音文件內(nèi)容進行檢索,其為企業(yè)和用戶提供語音文件的安全加密存儲,并且在語音數(shù)據(jù)不解密的情況下,對用戶提供利用文本關(guān)鍵字檢索語音內(nèi)容的功能,保證云存儲環(huán)境下語音文件的機密性,保護用戶的隱私不被侵犯,并提高檢索效率。
本發(fā)明的技術(shù)方案如下:
一種云存儲環(huán)境下中文語音密文存儲方法,適用于云服務端、服務端及用戶端組成的網(wǎng)絡系統(tǒng),其步驟包括:
1)接收并識別用戶端發(fā)送的語音文件,生成識別文本文件;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院信息工程研究所,未經(jīng)中國科學院信息工程研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011138829.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種大型鍋爐管道自動焊接裝置
- 下一篇:一種集成式電機液壓制動器
- 環(huán)境服務系統(tǒng)以及環(huán)境服務事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測終端和環(huán)境檢測系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計裝置和環(huán)境估計方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測儀(環(huán)境貓)





