[發明專利]一種基于二級倒排表的樹狀音頻特征索引庫建立方法在審
| 申請號: | 201810455198.0 | 申請日: | 2018-05-14 |
| 公開(公告)號: | CN108664622A | 公開(公告)日: | 2018-10-16 |
| 發明(設計)人: | 張衛強;袁慶升;劉藝;包秀國;張鴻;汪立東;杜翠蘭;劉洋;劉加 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心;清華大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京眾合誠成知識產權代理有限公司 11246 | 代理人: | 張文寶 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 索引庫建立 音頻特征 倒排表 量化 殘差 數字集成電路芯片 音頻數據庫 矢量量化 分段 | ||
1.一種基于二級倒排表的樹狀音頻特征索引庫建立方法,其特征在于,所述音頻特征索引庫建立方法在數字集成電路芯片中進行以下步驟:
步驟1:對音頻數據庫中的所有特征分段進行粗量化;
步驟2:對步驟1中的粗量化殘差進行二級粗量化;
步驟3:對粗量化殘差進行乘積矢量量化;
步驟4:插入倒排表。
2.根據權利要求1所述的基于二級倒排表的樹狀音頻特征索引庫建立方法,其特征在于:所述步驟1對所述音頻數據庫中的所有特征分段,每4幀組成一個音頻顆粒,對音頻顆粒矢量量化以進行所述粗量化。
3.根據權利要求2所述的基于二級倒排表的樹狀音頻特征索引庫建立方法,其特征在于:所述步驟1通過對所述音頻數據庫中的每個特征顆粒y進行所述粗量化得到粗量化編碼和所述粗量化殘差,粗量化編碼是指與y最近鄰的碼本編號,所述粗量化殘差是指y與最近鄰碼本的差值。
4.根據權利要求3所述的基于二級倒排表的樹狀音頻特征索引庫建立方法,其特征在于:所述步驟1中按所述粗量化形成的樹狀結構建立倒排表以形成一級倒排表,粗量化碼本數量等于一級倒排表入口的個數。
5.根據權利要求4所述的基于二級倒排表的樹狀音頻特征索引庫建立方法,其特征在于:為了再次減小需要搜索的音頻顆粒數量,所述步驟2使用矢量量化對所述步驟1的所述粗量化殘差進行所述二級粗量化,得到二級粗量化編碼。
6.根據權利要求5所述的基于二級倒排表的樹狀音頻特征索引庫建立方法,其特征在于:所述步驟3中粗量化殘差的維數與所述音頻顆粒y的維數相同,對所有音頻顆粒對應的殘差分成4組,采用乘積矢量量化,每組量化為1字節,每個音頻顆粒對應的所述乘積矢量量化結果為4字節。
7.根據權利要求6所述的基于二級倒排表的樹狀音頻特征索引庫建立方法,其特征在于:所述步驟4假設所述音頻顆粒y對應的粗量化編碼為i1,二級粗量化編碼為i2,所述每個音頻顆粒對應的乘積矢量量化得到的4字節碼字對應的唯一標識為ID,將ID與所述粗量化殘差組成的二元組插入到第i1個倒排索引的第i2個入口中。
8.根據權利要求1所述的基于二級倒排表的樹狀音頻特征索引庫建立方法,其特征在于:所述音頻特征索引庫建立方法在數字集成電路芯片中還包括步驟5:保存所述步驟1中的粗量化編碼和所述步驟2中的二級粗量化編碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心;清華大學,未經國家計算機網絡與信息安全管理中心;清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810455198.0/1.html,轉載請聲明來源鉆瓜專利網。





