[發明專利]用于輸出信息的方法和裝置有效
| 申請號: | 201810365079.6 | 申請日: | 2018-04-23 |
| 公開(公告)號: | CN108615006B | 公開(公告)日: | 2020-04-17 |
| 發明(設計)人: | 李超 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/38;G06K9/62;G10L25/27 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 輸出 信息 方法 裝置 | ||
本申請實施例公開了用于輸出信息的方法和裝置。該方法的一具體實施方式包括:獲取待處理的音頻的語譜圖;將語譜圖進行二值化處理,得到二值化圖像;從二值化圖像中確定出與預設的模板圖像匹配的目標區域,其中,模板圖像是由模板語譜圖通過二值化處理得到的;輸出目標區域對應的時間區間。該實施方式能夠提高音頻檢測的準確度。
技術領域
本申請實施例涉及聲音識別技術領域,具體涉及用于輸出信息的方法和裝置。
背景技術
隨著互聯網技術的不斷發展,互聯網已經成為人們生活中必不可少的工具。利用互聯網設備實現未知音頻的識別,并基于音頻識別的互動,成為一種新的應用趨勢。
現有技術中,常用的音頻識別軟件在調用音頻識別時,會播放一個特殊的音頻,用于提示用戶可輸入音頻。該段音頻在語音識別時需要被剪輯掉。但如果用戶在播放該特殊的音頻的時候輸入待處理音頻,則在音頻識別時需要保留特殊的音頻。不能僅通過音頻播放時間對待處理音頻進行剪輯。通常通過提取待識別音頻的聲紋特征,利用聲紋特征進行匹配,從待處理音頻中匹配出特殊的音頻。
發明內容
本申請實施例提出了用于輸出信息的方法和裝置。
第一方面,本申請實施例提供了一種用于輸出信息的方法,包括:獲取待處理的音頻的語譜圖;將語譜圖進行二值化處理,得到二值化圖像;從二值化圖像中確定出與預設的模板圖像匹配的目標區域,其中,模板圖像是由模板語譜圖通過二值化處理得到的;輸出目標區域對應的時間區間。
在一些實施例中,從二值化圖像中確定出與預設的模板圖像匹配的目標區域,包括:從二值化圖像中確定出與預設的模板圖像之間漢明距離小于預定距離閾值的區域作為目標區域。
在一些實施例中,從二值化圖像中確定出與預設的模板圖像匹配的目標區域,包括:從二值化圖像中確定出與預設的模板圖像之間的余弦相似度大于預定余弦相似度閾值的區域作為目標區域。
在一些實施例中,從二值化圖像中確定出與預設的模板圖像匹配的目標區域,包括:從二值化圖像中確定出與預設的模板圖像之間的相似度大于預定相似度閾值的區域作為候選區域;從候選區域中提取出特征向量;將特征向量輸入預設的分類器,輸出特征向量屬于預定類別的概率;響應于確定出輸出的特征向量屬于預定類別的概率大于預定概率閾值,將候選區域確定為目標區域。
在一些實施例中,從候選區域中提取出特征向量,包括:從候選區域的縱坐標的頻率區間范圍內選取至少一個預定的頻率作為特征頻率;對于選取出的特征頻率中的每個特征頻率,將候選區域中該特征頻率對應的像素點的像素值累加作為該特征頻率的特征值;根據各特征頻率的特征值生成特征向量。
在一些實施例中,上述方法還包括:將在時間區間范圍內的音頻片段從音頻中刪除。
第二方面,本申請實施例提供了一種用于輸出信息的裝置,包括:獲取單元,配置用于獲取待處理的音頻的語譜圖;處理單元,配置用于將語譜圖進行二值化處理,得到二值化圖像;匹配單元,配置用于從二值化圖像中確定出與預設的模板圖像匹配的目標區域,其中,模板圖像是由模板語譜圖通過二值化處理得到的;輸出單元,配置用于輸出目標區域對應的時間區間。
在一些實施例中,匹配單元進一步配置用于:從二值化圖像中確定出與預設的模板圖像之間漢明距離小于預定距離閾值的區域作為目標區域。
在一些實施例中,匹配單元進一步配置用于:從二值化圖像中確定出與預設的模板圖像之間的余弦相似度大于預定余弦相似度閾值的區域作為目標區域。
在一些實施例中,匹配單元進一步配置用于:從二值化圖像中確定出與預設的模板圖像之間的相似度大于預定相似度閾值的區域作為候選區域;從候選區域中提取出特征向量;將特征向量輸入預設的分類器,輸出特征向量屬于預定類別的概率;響應于確定出輸出的特征向量屬于預定類別的概率大于預定概率閾值,將候選區域確定為目標區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810365079.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:指紋識別組件、顯示裝置及電子裝置
- 下一篇:一種顯示面板及顯示裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





