[發明專利]一種基于聲紋識別的跨屏截取電視內容的方法在審

申請號：	201811185574.5	申請日：	2018-10-11
公開（公告）號：	CN110418159A	公開（公告）日：	2019-11-05
發明（設計）人：	劉曉初;黃克;葉小蕾;張元;王偉;周為;張戰軍	申請（專利權）人：	彩云之端文化傳媒（北京）有限公司
主分類號：	H04N21/233	分類號：	H04N21/233;H04N21/2343;H04N21/235;H04N21/258;H04N21/431;H04N21/435;H04N21/439;H04N21/4402;H04N21/45;H04N21/845;H04N21/8547
代理公司：	北京愛普納杰專利代理事務所(特殊普通合伙) 11419	代理人：	王玉松
地址：	100043 北京市石景山區石景***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	聲紋電視內容錄音片段聲紋識別截取跨屏視頻傳輸物理電視傳輸分離音頻模擬電視匹配步驟視頻編輯視頻截取數據傳輸數字電視業務應用推送泄密轉碼還原入庫局限發布應用網絡
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于聲紋識別的跨屏截取電視內容的方法，其特征在于，所述方法包括如下步驟：

S1：轉碼入庫步驟云端服務器監測頻道源的直播或點播的音視頻流，經轉碼后存入電視媒資庫，獲得轉碼入庫音視頻流；

S2：分離音頻步驟分離指定內容ID的轉碼入庫音視頻流，獲取指定內容ID音頻流；

S3：提取聲紋及建立聲紋庫步驟基于聲紋命令提取所述指定內容ID音頻流的聲音指紋，并將每個所述指定內容ID音頻流的聲音指紋存儲形成聲紋庫；所述內容ID包括直播頻道ID和點播節目ID；

S4：錄音片段聲紋提取步驟移動終端對正在播放的音視頻流進行錄音獲取多段時長錄音片段，然后提取每個錄音片段的聲音指紋；

S5：錄音片段聲紋匹配步驟將所述錄音片段的聲音指紋與所述聲紋庫中的聲音指紋進行匹配；匹配后，獲取該正在播放的音視頻流的內容ID和時間戳；

S6：識別結果推送步驟基于內容ID從所述電視媒資庫中查找到直播頻道或點播節目后，再以時間戳為起點向前截取T時長的直播頻道片段或點播節目片段，獲得的帶有識別結果的直播頻道或點播節目片段推送給手機端；

S7：短視頻截取步驟手機端獲取所述直播頻道或點播節目片段的播放窗口和截頻拖拽條，用戶根據所述播放窗口播放的所述直播頻道或點播節目片段拖動所述截頻拖拽條發出截取命令來截取感興趣的短視頻；

S8：短視頻編輯發布步驟為截取的所述短視頻編輯標題并添加話題或標簽后即可發布及分享。

2.如權利要求1所述的基于聲紋識別的跨屏截取電視內容的方法，其特征在于，所述頻道源包括來自IPTV、數字電視或模擬電視的音視頻流，所述音視頻流經過轉碼再進入步驟S1。

3.如權利要求3所述的基于聲紋識別的跨屏截取電視內容的方法，其特征在于，所述多段時長錄音片段包括m段T時長的錄音片段，第m段錄音片段大于第m-1段錄音片段的時長，T_m>T_m-1。

4.如權利要求4所述的基于聲紋識別的跨屏截取電視內容的方法，其特征在于，m為3時，T優選為3s、5s和15s。

5.如權利要求5所述的基于聲紋識別的跨屏截取電視節目的方法，其特征在于，所述匹配為m段錄音片段依次匹配。

6.如權利要求1所述的基于聲紋識別的跨屏截取電視節目的方法，其特征在于，所述匹配為m段錄音片段依次累積匹配。

7.如權利要求1所述的基于聲紋識別的跨屏截取電視節目的方法，其特征在于，所述截頻拖拽條顯示與所述播放內容的定位時間坐標對應的幀畫面，供用戶進行選擇。

8.如權利要求1所述的基于聲紋識別的跨屏截取電視內容的方法，其特征在于：所述聲音指紋的提取的特征參數包括MFCC、LPCC、△MFCC、△LPCC、能量、能量的一階差分以及GFCC中的一種或多種，其中：MFCC為梅爾頻率倒譜系數，LPCC為線性預測倒譜系數，△MFCC為MFCC的一階差分，△LPCC為LPCC的一階差分，GFCC為Gammatone濾波器倒譜系數；

所述聲紋匹配包括概率統計方法、DTW、VQ、HMM、ANN、SVM、DBN中的一種或多種，其中：DTW為動態時間規整、VQ為矢量量化、HMM為隱馬爾可夫模型、ANN為人工神經網絡方法、SVM為支持向量機、DBN為動態貝葉斯網絡。

9.如權利要求1所述的基于聲紋識別的跨屏截取電視內容的方法，其特征在于，所述S3步驟中，所述聲紋命令包括采樣時長命令，所述采樣時長命令包括指定轉碼入庫音視頻流的時長和采樣頻率。

10.一種基于聲紋識別的跨屏截取電視內容的方法，其特征在于，所述方法包括如下步驟：

S1：轉碼入庫步驟監測電視頻道的直播或點播的音視頻流，經轉碼后入電視媒資庫，獲得轉碼入庫音視頻流；

S2：分離音頻步驟分離指定內容ID的轉碼入庫音視頻流，獲取指定內容ID音頻流；

S3：提取聲紋及建立聲紋庫步驟基于聲紋命令和采樣時長指令提取所述指定內容ID音頻流和時長的聲音指紋，并將對每個所述指定內容ID音頻流和采樣時長的聲音指紋入聲紋庫；所述內容ID包括直播頻道ID和點播節目ID，每個采樣時長均含有特征參數并按照時間順序連接；

S4：錄音片段聲紋提取步驟移動終端對正在播放的音視頻流進行錄音獲取多段時長錄音片段，然后提取該錄音片段的聲音指紋；

S5：錄音片段聲紋匹配步驟將多段時長錄音片段的聲音指紋與所述聲紋庫中的聲音指紋進行聲紋匹配；匹配后，獲取該正在播放的音視頻流的內容ID；

S6：識別結果推送步驟基于內容ID從所述電視媒資庫中查找到直播頻道或點播節目后，再以采樣時長的特征參數匹配到該時長對應的直播頻道片段或點播節目片段，獲得的帶有識別結果的直播頻道或點播節目片段推送給手機端；

S7：短視頻獲取步驟手機端獲取所述直播頻道或點播節目片段；

S8：短視頻編輯發布步驟為所述短視頻編輯標題并添加話題或標簽后即可發布及分享。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于彩云之端文化傳媒（北京）有限公司，未經彩云之端文化傳媒（北京）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811185574.5/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：直播間業務配置方法及裝置、電子設備、存儲介質
下一篇：一種跨屏截取電視內容的方法

同類專利

專利分類

H 電學

H04 電通信技術
H04N 圖像通信，如電視
H04N21-00 可選的內容分發，例如交互式電視，VOD〔視頻點播〕
H04N21-20 .專門適用于內容分發的專用服務器，例如：VOD服務器；其操作
H04N21-40 .專門適用于接收內容或者與內容交互的客戶端設備，如STB[機頂盒]；相關操作
H04N21-60 .用于在服務器和客戶端之間或者在遠程客戶端之間的視頻分配的網絡結構或者處理
H04N21-80 .通過內容產生器獨立于分配過程實現的內容或附加數據的生成或處理；內容本身
H04N21-81 ..其單媒體部件

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】