[發明專利]聲音檢索裝置、聲音檢索方法有效
| 申請號: | 201510096120.0 | 申請日: | 2015-03-04 |
| 公開(公告)號: | CN104899240B | 公開(公告)日: | 2018-06-22 |
| 發明(設計)人: | 富田寬基 | 申請(專利權)人: | 卡西歐計算機株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 曾賢偉;文志 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢索詞 音素 輸出概率 檢索對象 聲音檢索裝置 區間指定部 聲音檢索 特征量 運算部 推定 運算 輸出 | ||
1.一種聲音檢索裝置,其特征在于,具備:
檢索詞取得單元,其取得檢索詞;
變換單元,其將上述檢索詞取得單元取得的檢索詞變換為音素串;
輸出概率取得單元,其針對每一幀,取得從上述音素串中包含的各音素輸出的檢索對象的聲音信號的特征量的輸出概率;
相對化運算單元,其對于上述輸出概率取得單元針對上述各音素取得的輸出概率,基于針對上述音素串中包含的另一音素取得的輸出概率執行相對化運算;
區間指定單元,其在上述檢索對象的聲音信號中指定多個似然取得區間;
似然取得單元,其根據上述相對化運算單元的運算后的輸出概率,取得表示上述區間指定單元指定的似然取得區間為發出了與上述檢索詞對應的聲音的區間的可能性的似然;
確定單元,其根據上述似然取得單元從上述區間指定單元所指定的似然取得區間中的各個似然取得區間取得的似然,確定被推定為從上述檢索對象的聲音信號中發出了與上述檢索詞對應的聲音的推定區間;
其中,所述聲音檢索裝置還具備:
搜索單元,其根據上述相對化運算單元的運算后的輸出概率,通過動態規劃法,搜索上述區間指定單元指定的似然取得區間中的各幀與上述音素串中包含的各音素的對應,上述似然取得單元根據通過上述搜索單元的搜索而與各幀相對應的各音素的上述相對化運算單元的運算結果,取得上述區間指定單元指定的似然取得區間的上述似然;
標準化運算單元,其在上述區間指定單元指定的似然取得區間,對于上述相對化運算單元的運算后的輸出概率,基于與該各音素對應的幀的數量進行標準化運算,計算對該似然取得區間的上述似然進行標準化后的標準化似然,上述確定單元根據上述標準化運算單元計算出的標準化似然,從上述區間指定單元指定的似然取得區間中確定上述推定區間。
2.根據權利要求1所述的聲音檢索裝置,其特征在于,
上述相對化運算單元包含:
基準音素選擇單元,其針對上述檢索對象的聲音信號中的各幀,從上述音素串中包含的音素中選擇基準音素;
相對值計算單元,其針對上述檢索對象的聲音信號中的各幀,根據a)基于針對上述音素串中包含的各音素而取得的該各幀的輸出概率的值和b)基于針對上述基準音素而取得的該各幀的輸出概率的值,計算相對值。
3.根據權利要求2所述的聲音檢索裝置,其特征在于,
上述輸出概率取得單元針對每一幀還取得從靜音素輸出上述檢索對象的聲音信號的特征量的輸出概率,
上述基準音素選擇單元針對上述檢索對象的聲音信號的各幀,從上述音素串中包含的音素和上述靜音素中,選擇該各幀的輸出概率最大的音素來作為上述基準音素。
4.根據權利要求1所述的聲音檢索裝置,其特征在于,
上述標準化運算單元在上述區間指定單元指定的似然取得區間,通過與該各音素對應的幀的數量,針對每個音素對基于上述相對化運算單元的運算后的輸出概率的值進行標準化然后進行加法運算,由此計算上述標準化似然。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于卡西歐計算機株式會社,未經卡西歐計算機株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510096120.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:檢測興趣點POI數據準確性的方法及裝置
- 下一篇:折疊便攜爐





