[發明專利]在播放視頻的設備中識別視頻中音頻的方法和裝置在審
| 申請號: | 201510875730.0 | 申請日: | 2015-12-02 |
| 公開(公告)號: | CN105430494A | 公開(公告)日: | 2016-03-23 |
| 發明(設計)人: | 宋治云;姜史哲 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | H04N21/439 | 分類號: | H04N21/439;H04N21/4722;H04N21/4402;H04N21/433;H04N21/435;H04N21/84;H04N21/41 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 播放 視頻 設備 識別 音頻 方法 裝置 | ||
1.一種在播放視頻的設備中識別視頻中音頻的方法,其特征在于,包括:
響應于用戶的截取指令而截取正在播放的視頻中的音頻信息;
對截取的音頻信息提取音頻特征,得到待識別音頻指紋;
比對所述待識別音頻指紋與預設的音頻指紋數據庫中的樂曲音頻指紋的相似度;
按照相似度從高至低,獲取預設數量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數據;
呈現查詢得到的元數據。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
接收用戶操作;
響應于所述用戶操作符合預設的觸發操作,觸發所述用戶的截取指令。
3.根據權利要求2所述的方法,其特征在于,響應于所述用戶操作符合預設的觸發操作,觸發所述用戶的截取指令包括以下一項或多項:
響應于所述用戶操作為對正在播放的視頻中呈現的截取選項的選擇操作,并且所述選擇操作符合預設的觸發操作,觸發所述用戶的截取指令;
響應于所述用戶操作為對快捷鍵的按鍵操作,并且所述按鍵操作符合預設的觸發操作,觸發所述用戶的截取指令;
響應于所述用戶操作為指紋輸入,并且所述指紋輸入為預設的觸發操作,觸發所述用戶的截取指令;
響應于所述用戶操作為音波輸入,并且所述音波輸入為預設的觸發操作,觸發所述用戶的截取指令;以及
響應于所述用戶操作為正在播放視頻的設備感應到的操作,并且所述感應到的操作符合預設的觸發操作,觸發所述用戶的截取指令。
4.根據權利要求1-3任意一項所述的方法,其特征在于,所述響應于用戶的截取指令而截取正在播放的視頻中的音頻信息包括:
響應于用戶的截取指令而截取所述正在播放的視頻的音頻源文件,得到截取的音頻信息;和/或
響應于用戶的截取指令而對所述正在播放的視頻進行錄音,得到截取的音頻信息。
5.根據權利要求4所述的方法,其特征在于,在云端服務器進行以下一項或多項操作:
對截取的音頻信息提取音頻特征,得到待識別音頻指紋;
比對所述待識別音頻指紋與預設的音頻指紋數據庫中的樂曲音頻指紋的相似度;
按照相似度從高至低,獲取預設數量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數據。
6.根據權利要求5所述的方法,其特征在于,通過以下一項或多項表現形式向用戶呈現查詢得到的樂曲的元數據:
語音、文本、圖片和流媒體。
7.根據權利要求6所述的方法,其特征在于,在預設位置以以下一項或多項呈現方式向用戶呈現查詢得到的樂曲的元數據:
預設顏色、預設亮度和預設遮罩狀態。
8.一種在播放視頻的設備中識別視頻中音頻的裝置,其特征在于,所述裝置包括:
截取模塊,用于響應于用戶的截取指令而截取正在播放的視頻中的音頻信息;
提取模塊,用于對截取的音頻信息提取音頻特征,得到待識別音頻指紋;
比對模塊,用于比對所述待識別音頻指紋與預設的音頻指紋數據庫中的樂曲音頻指紋的相似度;
獲取模塊,用于按照相似度從高至低,獲取預設數量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數據;
呈現模塊,用于呈現查詢得到的樂曲的元數據。
9.根據權利要求8所述的裝置,其特征在于,所述裝置還包括:
接收模塊,用于接收用戶操作;
觸發模塊,用于響應于所述用戶操作符合預設的觸發操作,觸發所述用戶的截取指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510875730.0/1.html,轉載請聲明來源鉆瓜專利網。





