[發明專利]一種基于聲紋識別的跨屏截取電視內容的方法在審
| 申請號: | 201811185574.5 | 申請日: | 2018-10-11 |
| 公開(公告)號: | CN110418159A | 公開(公告)日: | 2019-11-05 |
| 發明(設計)人: | 劉曉初;黃克;葉小蕾;張元;王偉;周為;張戰軍 | 申請(專利權)人: | 彩云之端文化傳媒(北京)有限公司 |
| 主分類號: | H04N21/233 | 分類號: | H04N21/233;H04N21/2343;H04N21/235;H04N21/258;H04N21/431;H04N21/435;H04N21/439;H04N21/4402;H04N21/45;H04N21/845;H04N21/8547 |
| 代理公司: | 北京愛普納杰專利代理事務所(特殊普通合伙) 11419 | 代理人: | 王玉松 |
| 地址: | 100043 北京市石景山區石景*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲紋 電視內容 錄音片段 聲紋識別 截取 跨屏 視頻 傳輸物理 電視傳輸 分離音頻 模擬電視 匹配步驟 視頻編輯 視頻截取 數據傳輸 數字電視 業務應用 推送 泄密 轉碼 還原 入庫 局限 發布 應用 網絡 | ||
1.一種基于聲紋識別的跨屏截取電視內容的方法,其特征在于,所述方法包括如下步驟:
S1:轉碼入庫步驟云端服務器監測頻道源的直播或點播的音視頻流,經轉碼后存入電視媒資庫,獲得轉碼入庫音視頻流;
S2:分離音頻步驟分離指定內容ID的轉碼入庫音視頻流,獲取指定內容ID音頻流;
S3:提取聲紋及建立聲紋庫步驟基于聲紋命令提取所述指定內容ID音頻流的聲音指紋,并將每個所述指定內容ID音頻流的聲音指紋存儲形成聲紋庫;所述內容ID包括直播頻道ID和點播節目ID;
S4:錄音片段聲紋提取步驟移動終端對正在播放的音視頻流進行錄音獲取多段時長錄音片段,然后提取每個錄音片段的聲音指紋;
S5:錄音片段聲紋匹配步驟將所述錄音片段的聲音指紋與所述聲紋庫中的聲音指紋進行匹配;匹配后,獲取該正在播放的音視頻流的內容ID和時間戳;
S6:識別結果推送步驟基于內容ID從所述電視媒資庫中查找到直播頻道或點播節目后,再以時間戳為起點向前截取T時長的直播頻道片段或點播節目片段,獲得的帶有識別結果的直播頻道或點播節目片段推送給手機端;
S7:短視頻截取步驟手機端獲取所述直播頻道或點播節目片段的播放窗口和截頻拖拽條,用戶根據所述播放窗口播放的所述直播頻道或點播節目片段拖動所述截頻拖拽條發出截取命令來截取感興趣的短視頻;
S8:短視頻編輯發布步驟為截取的所述短視頻編輯標題并添加話題或標簽后即可發布及分享。
2.如權利要求1所述的基于聲紋識別的跨屏截取電視內容的方法,其特征在于,所述頻道源包括來自IPTV、數字電視或模擬電視的音視頻流,所述音視頻流經過轉碼再進入步驟S1。
3.如權利要求3所述的基于聲紋識別的跨屏截取電視內容的方法,其特征在于,所述多段時長錄音片段包括m段T時長的錄音片段,第m段錄音片段大于第m-1段錄音片段的時長,Tm>Tm-1。
4.如權利要求4所述的基于聲紋識別的跨屏截取電視內容的方法,其特征在于,m為3時,T優選為3s、5s和15s。
5.如權利要求5所述的基于聲紋識別的跨屏截取電視節目的方法,其特征在于,所述匹配為m段錄音片段依次匹配。
6.如權利要求1所述的基于聲紋識別的跨屏截取電視節目的方法,其特征在于,所述匹配為m段錄音片段依次累積匹配。
7.如權利要求1所述的基于聲紋識別的跨屏截取電視節目的方法,其特征在于,所述截頻拖拽條顯示與所述播放內容的定位時間坐標對應的幀畫面,供用戶進行選擇。
8.如權利要求1所述的基于聲紋識別的跨屏截取電視內容的方法,其特征在于:所述聲音指紋的提取的特征參數包括MFCC、LPCC、△MFCC、△LPCC、能量、能量的一階差分以及GFCC中的一種或多種,其中:MFCC為梅爾頻率倒譜系數,LPCC為線性預測倒譜系數,△MFCC為MFCC的一階差分,△LPCC為LPCC的一階差分,GFCC為Gammatone濾波器倒譜系數;
所述聲紋匹配包括概率統計方法、DTW、VQ、HMM、ANN、SVM、DBN中的一種或多種,其中:DTW為動態時間規整、VQ為矢量量化、HMM為隱馬爾可夫模型、ANN為人工神經網絡方法、SVM為支持向量機、DBN為動態貝葉斯網絡。
9.如權利要求1所述的基于聲紋識別的跨屏截取電視內容的方法,其特征在于,所述S3步驟中,所述聲紋命令包括采樣時長命令,所述采樣時長命令包括指定轉碼入庫音視頻流的時長和采樣頻率。
10.一種基于聲紋識別的跨屏截取電視內容的方法,其特征在于,所述方法包括如下步驟:
S1:轉碼入庫步驟監測電視頻道的直播或點播的音視頻流,經轉碼后入電視媒資庫,獲得轉碼入庫音視頻流;
S2:分離音頻步驟分離指定內容ID的轉碼入庫音視頻流,獲取指定內容ID音頻流;
S3:提取聲紋及建立聲紋庫步驟基于聲紋命令和采樣時長指令提取所述指定內容ID音頻流和時長的聲音指紋,并將對每個所述指定內容ID音頻流和采樣時長的聲音指紋入聲紋庫;所述內容ID包括直播頻道ID和點播節目ID,每個采樣時長均含有特征參數并按照時間順序連接;
S4:錄音片段聲紋提取步驟移動終端對正在播放的音視頻流進行錄音獲取多段時長錄音片段,然后提取該錄音片段的聲音指紋;
S5:錄音片段聲紋匹配步驟將多段時長錄音片段的聲音指紋與所述聲紋庫中的聲音指紋進行聲紋匹配;匹配后,獲取該正在播放的音視頻流的內容ID;
S6:識別結果推送步驟基于內容ID從所述電視媒資庫中查找到直播頻道或點播節目后,再以采樣時長的特征參數匹配到該時長對應的直播頻道片段或點播節目片段,獲得的帶有識別結果的直播頻道或點播節目片段推送給手機端;
S7:短視頻獲取步驟手機端獲取所述直播頻道或點播節目片段;
S8:短視頻編輯發布步驟為所述短視頻編輯標題并添加話題或標簽后即可發布及分享。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于彩云之端文化傳媒(北京)有限公司,未經彩云之端文化傳媒(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811185574.5/1.html,轉載請聲明來源鉆瓜專利網。





