[發明專利]在播放視頻的設備中識別視頻中音頻的方法和裝置在審
| 申請號: | 201510875730.0 | 申請日: | 2015-12-02 |
| 公開(公告)號: | CN105430494A | 公開(公告)日: | 2016-03-23 |
| 發明(設計)人: | 宋治云;姜史哲 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | H04N21/439 | 分類號: | H04N21/439;H04N21/4722;H04N21/4402;H04N21/433;H04N21/435;H04N21/84;H04N21/41 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 播放 視頻 設備 識別 音頻 方法 裝置 | ||
技術領域
本申請涉及計算機技術領域,具體涉及音頻處理領域,尤其涉及在播放視頻的設備中識別視頻中音頻的方法和裝置。
背景技術
隨著娛樂信息技術的蓬勃發展,用戶越來越追求高質、高速且無障礙的信息獲取。例如,用戶在觀看視頻時,若聽到好聽的背景音樂,可能希望獲得背景音樂的樂曲信息。
目前,在觀看視頻時獲取背景音樂的樂曲信息的方式,通常是在第二設備中打開基于音頻識別樂曲的應用,以接收來自播放視頻的第一設備的音頻,并對該音頻進行分析處理后給出結果。
然而,這種跨設備進行的音頻識別方式,可能存在較大的環境噪音,因此會產生較大的識別誤差或導致識別失敗。
發明內容
本申請的目的在于提出一種在播放視頻的設備中識別視頻中音頻的方法和裝置,來解決以上背景技術部分提到的技術問題。
第一方面,本申請提供了一種在播放視頻的設備中識別視頻中音頻的方法,包括:響應于用戶的截取指令而截取正在播放的視頻中的音頻信息;對截取的音頻信息提取音頻特征,得到待識別音頻指紋;比對所述待識別音頻指紋與預設的音頻指紋數據庫中的樂曲音頻指紋的相似度;按照相似度從高至低,獲取預設數量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數據;呈現查詢得到的元數據。
在一些實施例中,所述方法還包括:接收用戶操作;響應于所述用戶操作符合預設的觸發操作,觸發所述用戶的截取指令。
在一些實施例中,響應于所述用戶操作符合預設的觸發操作,觸發所述用戶的截取指令包括以下一項或多項:響應于所述用戶操作為對正在播放的視頻中呈現的截取選項的選擇操作,并且所述選擇操作符合預設的觸發操作,觸發所述用戶的截取指令;響應于所述用戶操作為對快捷鍵的按鍵操作,并且所述按鍵操作符合預設的觸發操作,觸發所述用戶的截取指令;響應于所述用戶操作為指紋輸入,并且所述指紋輸入為預設的觸發操作,觸發所述用戶的截取指令;響應于所述用戶操作為音波輸入,并且所述音波輸入為預設的觸發操作,觸發所述用戶的截取指令;以及響應于所述用戶操作為正在播放視頻的設備感應到的操作,并且所述感應到的操作符合預設的觸發操作,觸發所述用戶的截取指令。
在一些實施例中,所述響應于用戶的截取指令而截取正在播放的視頻中的音頻信息包括:響應于用戶的截取指令而截取所述正在播放的視頻的音頻源文件,得到截取的音頻信息;和/或響應于用戶的截取指令而對所述正在播放的視頻進行錄音,得到截取的音頻信息。
在一些實施例中,在云端服務器進行以下一項或多項操作:對截取的音頻信息提取音頻特征,得到待識別音頻指紋;比對所述待識別音頻指紋與預設的音頻指紋數據庫中的樂曲音頻指紋的相似度;按照相似度從高至低,獲取預設數量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數據。
在一些實施例中,通過以下一項或多項表現形式向用戶呈現查詢得到的樂曲的元數據:語音、文本、圖片和流媒體。
在一些實施例中,在預設位置以以下一項或多項呈現方式向用戶呈現查詢得到的樂曲的元數據:預設顏色、預設亮度和預設遮罩狀態。
第二方面,本申請提供了一種在播放視頻的設備中識別視頻中音頻的裝置,其特征在于,所述裝置包括:截取模塊,用于響應于用戶的截取指令而截取正在播放的視頻中的音頻信息;提取模塊,用于對截取的音頻信息提取音頻特征,得到待識別音頻指紋;比對模塊,用于比對所述待識別音頻指紋與預設的音頻指紋數據庫中的樂曲音頻指紋的相似度;獲取模塊,用于按照相似度從高至低,獲取預設數量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數據;呈現模塊,用于呈現查詢得到的樂曲的元數據。
在一些實施例中,所述裝置還包括:接收模塊,用于接收用戶操作;觸發模塊,用于響應于所述用戶操作符合預設的觸發操作,觸發所述用戶的截取指令。
在一些實施例中,所述觸發模塊包括以下一項或多項:選項觸發模塊,用于響應于所述用戶操作為對正在播放的視頻中呈現的截取選項的選擇操作,并且所述選擇操作符合預設的觸發操作,觸發所述用戶的截取指令;快捷鍵觸發模塊,用于響應于所述用戶操作為對快捷鍵的按鍵操作,并且所述按鍵操作符合預設的觸發操作,觸發所述用戶的截取指令;指紋觸發模塊,用于響應于所述用戶操作為指紋輸入,并且所述指紋輸入為預設的觸發操作,觸發所述用戶的截取指令;音波觸發模塊,用于響應于所述用戶操作為音波輸入,并且所述音波輸入為預設的觸發操作,觸發所述用戶的截取指令;以及感應觸發模塊,用于響應于所述用戶操作為正在播放視頻的設備感應到的操作,并且所述感應到的操作符合預設的觸發操作,觸發所述用戶的截取指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510875730.0/2.html,轉載請聲明來源鉆瓜專利網。





