[發明專利]一種用于保護漢語語音私密度的掩蔽信號的生成方法有效
| 申請號: | 201510094030.8 | 申請日: | 2015-03-03 |
| 公開(公告)號: | CN104637485B | 公開(公告)日: | 2018-05-01 |
| 發明(設計)人: | 李曄;馬曉鳳;郝秋赟;樊燕紅;姜競賽;張鵬 | 申請(專利權)人: | 山東省計算中心(國家超級計算濟南中心) |
| 主分類號: | G10L19/018 | 分類號: | G10L19/018 |
| 代理公司: | 濟南泉城專利商標事務所37218 | 代理人: | 褚慶森 |
| 地址: | 250014 山東省濟*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 保護 漢語 語音 密度 掩蔽 信號 生成 方法 | ||
技術領域
本發明涉及一種用于保護漢語語音私密度的掩蔽信號的生成方法,更具體的說,尤其涉及一種可形成無實際意義的、與正常說話語音極其相似的、減小了聽覺上負面影響的用于保護漢語語音私密度的掩蔽信號的生成方法。
背景技術
會議室保密涉及到國家、商業、科技等機密信息的保護,屬于信息安全領域,從國家安全到商業應用都有迫切的需求,商業竊聽每年給國家造成的經濟損失可達數百億元。作為保密會議室最基本的信息形式,聲音是需要保護的重點。保密會議室中聲音信息的泄露主要有兩種方式:主動泄露和無意識泄露。主動泄露指的是通過在會議室內部安裝竊聽設備所造成的泄露,而無意識泄露指的是會議召開期間,聲音通過空氣傳聲、固體傳聲等方式泄露,而被非授權人員聽到。具體而言,聲音信號無意識泄露的通道主要包括:門、窗、墻體以及各種管道等。本文所提出的方法主要針對聲音信號的無意識泄露。目前,針對聲音信號的無意識泄露,大都采用聲掩蔽技術進行防護。具體而言,就是在可能存在聲音泄露的位置、途徑上布設干擾源,產生干擾信號,從而掩蔽有用的語音信號,從而達到聲音泄露防護的作用。上述干擾信號被稱為掩蔽信號。
掩蔽信號的選擇要考慮兩個方面的因素,一是掩蔽效果,二是掩蔽信號對人的心理和生理影響。目前常見的掩蔽信號主要有白噪聲、粉噪聲、暖通空調噪聲等。白噪聲和粉噪聲,通常具有比較穩定的統計特性,但掩蔽效率較低。而暖通空調噪聲信號本身具有不連續、不穩定、分布不均或是聲音級過高,有時候反而成為噪聲源,對人的心理和生理影響比較大,負面效應明顯。
發明內容
本發明的主要目的是利用漢語發音的特點,包括字、詞、句的各項統計特性,合成一種新的掩蔽信號,由于其與正常發音的統計特性類似,因而不容易被破解,掩蔽效果好,同時會降低掩蔽信號對人心理和生理的影響,兼具一定的迷惑性。
本發明的用于保護漢語語音私密度的掩蔽信號的生成方法,其特別之處在于,通過以下步驟來實現:
a).統計語句概率表,以具有代表性的漢語語料庫為統計樣本,對語料庫中每個段落所包含的語句數進行統計,獲得組成段落的語句數的概率表,簡稱語句概率表,其中表示語句數目為的段落占所有段落的百分比,1≤≤;
b).統計句段概率表,對語料庫中所有語句所包含的句段數進行統計,獲得語句的句段數的概率表,簡稱句段概率表,其中表示句段數目為的語句占所有語句的百分比,1≤≤;
c).統計詞組概率表,對語料庫中所有句段所包含的詞組數進行統計,獲得句段的詞組數的概率表,簡稱詞組概率表,其中表示詞組數目為的句段占所有句段的百分比,1≤≤;
d).統計漢字概率表,對語料庫中所有詞組所包含的漢字數進行統計,獲得詞組的漢字數的概率表,簡稱漢字概率表,其中表示漢字數目為的詞組占所有詞組的百分比,1≤≤;
e).統計音節概率表,首先按照字母順序對音節進行排序,記為,然后根據各音節在日常用語中出現的概率,獲得音節概率表,簡稱音節概率表,其中表示音節在日常用語中出現的頻率,1≤≤;
f).生成文本信息,按照如下步驟生成語音對應的文本信息:
f-1).確定自然段的語句數,在區間范圍內產生隨機數,并判斷隨機數所屬區間;如果在區間內,則得出自然段中所包含的語句數為,其中,1≤≤,;通過步驟f-2)確定出自然段中的每個語句;
例如,若隨機數,則該自然段包含1個語句,若,則該自然段包含2個語句,依此類推;
f-2).確定語句中的句段數,在區間范圍內產生隨機數,并判斷隨機數所屬區間;如果在區間內,則得出語句中所包含的句段數為,其中,1≤≤,;通過步驟f-3)確定出每個語句中的句段;
例如,若隨機數,則該語句包含1個句段,若,則該語句包含2個句段,依此類推;
f-3).確定句段中的詞組數,在區間范圍內產生隨機數,并判斷隨機數所屬區間;如果在區間內,則得出句段中所包含的詞組數為,其中,1≤≤,;通過步驟f-4)確定每個句段中的詞組;
例如,若隨機數,則該句段包含1個詞組,若,則該句段包含2個詞組,依此類推;
f-4).確定詞組中的漢字數,在區間范圍內產生隨機數,并判斷隨機數所屬區間;如果在區間內,則得出詞組中所包含的漢字數為,漢字數即音節數,每個漢字對應一個音節,其中,1≤≤,;通過步驟f-5)確定每個漢字的音節;
例如,若隨機數,則該詞組包含1個漢字,若,則該詞組包含2個漢字,依此類推;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東省計算中心(國家超級計算濟南中心),未經山東省計算中心(國家超級計算濟南中心)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510094030.8/2.html,轉載請聲明來源鉆瓜專利網。





