[發(fā)明專利]基于量子傅里葉變換的語音特征提取方法有效
| 申請?zhí)枺?/td> | 202011492533.8 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112669874B | 公開(公告)日: | 2023-08-15 |
| 發(fā)明(設計)人: | 李陽陽;楊丹青;劉睿嬌;毛鶴亭;趙裴翔;趙逸群;焦李成;李玲玲 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03 |
| 代理公司: | 陜西電子工業(yè)專利中心 61205 | 代理人: | 陳宏社;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 量子 傅里葉變換 語音 特征 提取 方法 | ||
本發(fā)明提出了一種基于量子傅里葉變換的語音特征提取方法,旨在不降低語音信號特征提取分辨率的前提下,提高語音信號特征提取的速度,實現步驟為:1)初始化量子計算機參數;2)對語音信號進行離散化;3)通過量子計算機獲取每個時域語音信號段的二進制量子態(tài);4)通過量子計算機對二進制量子態(tài)進行量子傅里葉變換;5)通過量子計算機對時域語音信號段數字矩陣進行量子化編碼;6)通過量子計算機獲取語音信號的特征提取結果。利用量子邏輯門實現量子傅里葉變換,完成每一個二進制量子態(tài)的轉換,相當于同時完成多次加減乘除操作,計算次數明顯減少,有效提高了語音特征提取的速度。
技術領域
本發(fā)明屬于語音特征提取領域,涉及一種基于量子傅里葉變換實現的語音特征提取方法,可以實現語音信號的特征提取,提高語音特征提取的速度。
背景技術
語言是人類特有的溝通方式,語音特征提取是實現人機交互的重要手段,語音特征可以幫助計算機理解人類語言,利用計算機正確提取語言信號特征是計算機發(fā)展技術中面臨的重要問題。分辨率和最小檢測時間代價是語音特征提取的重要指標,隨著語音識別技術廣泛應用于國家安全、電話銀行、網絡社交、軍事情報等各個領域,人們對語音特征提取的實時性要求也越來越高,因此需要在保證語音信號特征分辨率不降低的前提下,降低其最小檢測時間代價。在語音特征提取中,需要對時域語音信號進行采樣,采樣后的語音信號利用傅里葉變換、小波變換或S變換等方法,提取頻域或者小波域的特征,繪制語音信號的特征頻譜圖。頻域語音信號可以使在時域上無法表現出來的某些特征變得十分明顯,因此如何高效實時地將時域信號轉換為頻域信號,對語音信號特征提取的性能具有重要意義。
量子計算與量子信息是一門新興綜合性交叉學科。量子計算機是量子力學理論和經典計算機理論完美結合的產物,它的特點主要有運行速度較快、處置信息能力較強、應用范圍較廣等。量子計算機對每一個疊加分量實現的變換相當于同時進行多次加減乘除計算,并按一定的概率振幅疊加起來,這種計算稱為量子并行計算,也是量子計算機最重要的優(yōu)越性。2019年10月23日,谷歌打造出了第一臺能夠超越當今最強大的超級計算機能力的量子計算機。該量子系統(tǒng)只用了200秒完成一個計算,而同樣的計算用當今最強大的超級計算機Summit執(zhí)行,需要約10000年。2020年12月4日,中國科學技術大學宣布該校潘建偉等人成功構建76個光子的量子計算原型機“九章”,求解數學算法高斯玻色取樣只需200秒,比目前最快的超級計算機快一百萬億倍。
量子傅里葉變換首次提出,是被Shor應用在大數質因子分解算法中,由于采用量子傅里葉變換后,算法的運行速度加快很多,因此,針對量子計算機,在以后的量子算法中,量子傅里葉變換作為最為關鍵的一個子程序被廣泛應用。針對量子傅里葉變換的研究逐漸增多,Hallgren等人采用改進的量子傅里葉變換對任意區(qū)間的周期函數進行應用,Y.S.Nam等人利用帶狀量子傅里葉變換對Shor算法定義了新的標定規(guī)則,取得了很好的搜索效果。南京航空航天大學的周日貴等采用量子傅里葉變換作為模式特征提取算法,并證明和驗證了該算法的可行性和有效性。量子傅里葉變換可以將時域信號轉換為頻域信號,它利用量子邏輯門同時完成多種經典計算,計算次數明顯減少,算法時間復雜度低,將量子傅里葉變換應用于語音特征提取,可以提高語音信號特征提取的速度。
例如申請公布號為CN?106782501?A,名稱為“基于人工智能的語音特征提取方法和裝置”的專利申請,公開了一種運用利用人工智能進行語音特征提取的方法,通過短時傅里葉變換對待識別語音進行頻譜分析,得到待識別語音的語譜圖之后,利用VGG卷積神經網絡對語譜圖進行特征提取,得到語音特征。其優(yōu)點在于,對待識別語音進行短時傅里葉變換后利用VGG卷積神經網絡對語譜圖進行特征提取,提高了算法語音特征分辨率。然而,利用短時傅里葉變換將語音信號從時域轉換到頻域,其缺點在于,算法使用短時傅里葉變換時間復雜度較高,導致在大數據時代,面對大量語音數據時,其特征提取需要花費很高的時間代價,因此不能較好地滿足實時性要求。
發(fā)明內容
針對上述現有技術的不足,提出了一種基于量子傅里葉變換的語音特征提取方法,旨在保證語音信號特征分辨率不降低的前提下,提高語音信號特征提取的速度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011492533.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據限流方法、組件及工具包
- 下一篇:一種木屑纖維的處理工藝





