[發明專利]測量相似度的方法和設備在審
| 申請號: | 201510836761.5 | 申請日: | 2011-08-19 |
| 公開(公告)號: | CN105355214A | 公開(公告)日: | 2016-02-24 |
| 發明(設計)人: | 蘆烈;胡明清 | 申請(專利權)人: | 杜比實驗室特許公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 杜誠;李春暉 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 測量 相似 方法 設備 | ||
1.一種測量兩個音頻分段之間的內容相似度的方法,包括:
從所述音頻分段中提取第一特征向量,其中所述第一特征向量中的每一個中的所有特征值都是非負的并被歸一化,使得所述特征值的和為1;
根據所述特征向量,基于狄里克雷分布生成用于計算所述內容相似度的統計模型;以及
基于所生成的統計模型計算所述內容相似度。
2.根據權利要求1所述的方法,其中,所述提取包括:
從所述音頻分段中提取第二特征向量;以及
針對所述第二特征向量中的每一個,計算用于測量該第二特征向量與參考向量中的每一個之間的關系的量,其中與所述第二特征向量相對應的所有量形成所述第一特征向量中的一個。
3.根據權利要求2所述的方法,其中,通過以下方法之一確定所述參考向量:
隨機產生法,其中隨機生成所述參考向量;
無監督聚類法,其中提取自訓練樣本的訓練向量被分組為聚類,并計算所述參考向量以分別代表所述聚類;
監督建模法,其中根據所述訓練向量來人工定義和學習所述參考向量;以及
特征分解法,其中將所述參考向量計算為以所述訓練向量作為行的矩陣的特征向量。
4.根據權利要求2所述的方法,其中,通過以下各量之一測量所述第二特征向量與所述參考向量中的每一個之間的關系
所述第二特征向量與該參考向量之間的距離;
所述第二特征向量與該參考向量之間的相關;
所述第二特征向量與該參考向量之間的內積;以及
該參考向量的以所述第二特征向量作為相關證據的后驗概率。
5.一種用于測量兩個音頻分段之間的內容相似度的設備,包括:
特征生成器,其從所述音頻分段中提取第一特征向量,其中所述第一特征向量中的每一個中的所有特征值都是非負的并被歸一化,使得所述特征值的和為1;
模型生成器,其根據所述特征向量,基于狄里克雷分布生成用于計算所述內容相似度的統計模型;以及
相似度計算器,其基于所生成的統計模型計算所述內容相似度。
6.根據權利要求5所述的設備,其中,所述特征生成器被進一步配置為,
從所述音頻分段中提取第二特征向量;以及
針對所述第二特征向量中的每一個,計算用于測量該第二特征向量與參考向量中的每一個之間的關系的量,其中與所述第二特征向量相對應的所有量形成所述第一特征向量中的一個。
7.根據權利要求6所述的設備,其中,通過以下方法之一確定所述參考向量:
隨機產生法,其中隨機生成所述參考向量;
無監督聚類法,其中提取自訓練樣本的訓練向量被分組為聚類,并計算所述參考向量以分別代表所述聚類;
監督建模法,其中根據所述訓練向量來人工定義和學習所述參考向量;以及
特征分解法,其中將所述參考向量計算為以所述訓練向量作為行的矩陣的特征向量。
8.根據權利要求6所述的設備,其中,通過以下各量之一測量所述第二特征向量與所述參考向量中的每一個之間的關系:
所述第二特征向量與該參考向量之間的距離;
所述第二特征向量與該參考向量之間的相關;
所述第二特征向量與該參考向量之間的內積;以及
該參考向量的以所述第二特征向量作為相關證據的后驗概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比實驗室特許公司,未經杜比實驗室特許公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510836761.5/1.html,轉載請聲明來源鉆瓜專利網。





