[發(fā)明專利]一種音視頻內容過濾系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 201710680389.2 | 申請日: | 2017-08-10 |
| 公開(公告)號: | CN107493501B | 公開(公告)日: | 2020-07-10 |
| 發(fā)明(設計)人: | 王恒生 | 申請(專利權)人: | 人民網(wǎng)信息技術有限公司 |
| 主分類號: | H04N21/439 | 分類號: | H04N21/439;H04N21/44;H04N21/442;G10L25/63 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 250002 山東省濟南*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 內容 過濾 系統(tǒng) 方法 | ||
本發(fā)明涉及智能播放技術領域,尤其涉及一種音視頻內容過濾系統(tǒng)及方法。包括:情緒監(jiān)測模塊,在播放音視頻內容時實時檢測觀眾情緒,在觀眾情緒為目標情緒時獲取疑似音視頻內容;根據(jù)疑似音視頻內容更新疑似音頻信息和疑似視頻信息。播放模塊,當疑似音頻信息的觸發(fā)次數(shù)大于預設的音頻觀察次數(shù)時,過濾包括疑似音頻信息對應的音頻幀類的音視頻內容;當疑似視頻信息的觸發(fā)次數(shù)大于預設的視頻觀察次數(shù)時,過濾包括疑似視頻信息對應的過濾對象的音視頻內容。通過情緒監(jiān)測模塊實時監(jiān)測觀眾的情緒,主動學習引起觀眾不適的音視頻內容的聲音特征和對象,動態(tài)更新疑似音頻信息和疑似視頻信息,使可能引起觀眾不適的音視頻內容能夠在沒有被播放時就被跳過。
技術領域
本發(fā)明涉及智能播放技術領域,尤其涉及一種音視頻內容過濾系統(tǒng)及方法。
背景技術
許多人熱衷于觀看恐怖片,恐怖片不僅會有嚇人的片段,還會有嚇人的聲音。在播放到最嚇人的片段或者嚇人的聲音時,可能還會出現(xiàn)缺乏勇氣觀看的情況。但是,直接關閉上述視頻,顯然是不符合觀看者的意圖的,但是如何準確的跳過這些發(fā)出嚇人聲音的視頻片段,成為了難以解決的問題。
另外,尤其是兒童在觀看視頻的時候,在某些非恐怖片類型的視頻中可能也存在一些比較嚇人或者令他們害怕的聲音。而由于兒童無法很好的表達,也不能很好的操作視頻播放設備,所以不能自主的去篩選音頻內容。
申請公布號CN 106454490 A,授權公布日2017年2月22日的發(fā)明專利申請公開了一種智能播放視頻的方法及裝置。所述智能播放視頻的方法,包括:實施監(jiān)測用戶的圖像;根據(jù)用戶的圖像通過預設的人體圖像算法,分析出用戶的身體部位,所述用戶的身體部位包括頭部、眼部和手部中任一者或者多者;判斷所述手部是否遮蓋住所述眼部;當所述手部遮蓋住所述眼部是,快進正在播放的視頻;當滿足預設的回復正常播放功能的條件時,中止快進視頻的狀態(tài),回復正常的播放狀態(tài)播放所述視頻。實現(xiàn)了在用戶觀看特殊類型的視頻時,準確理解用戶的意圖,自動的、智能的播放視頻的功能,從而提升用戶的觀看體驗。
但是該技術方案具有下述不足:
1.該技術方案中,根據(jù)用戶是否發(fā)生遮蓋眼睛的動作來判斷是否需要快進正在播放的視頻。既然用戶已經(jīng)用手捂住眼睛了,那么當前的播放內容是否快進對用戶來講意義不大。
2.不同的用戶對于引起其不適的視頻的反應是不同的,比如有的用戶會發(fā)出尖叫、有的用戶用手捂住眼睛、還有的用戶可能僅僅是面部表情的表面。僅僅通過用戶遮蓋眼睛的動作來觸發(fā)快進當前播放視頻的操作,會導致該技術方案的方法或者裝置對發(fā)生其他類型的反應用戶無效。
3.總是要等到用戶觀看到引起不適的視頻,導致用戶發(fā)生了用手遮蓋眼睛的動作以后才會觸發(fā)快進的操作,無法預先估計哪些音頻內容會引起用戶的不適。
發(fā)明內容
本發(fā)明為了解決上述技術問題,提出一種音視頻內容過濾系統(tǒng),其特征在于,包括:視頻幀數(shù)據(jù)庫、音頻幀數(shù)據(jù)庫、播放模塊、情緒監(jiān)測模塊;
所述音頻幀數(shù)據(jù)庫,用于對待播放的音視頻內容中的所有音頻幀進行聚類分析得到音頻幀類,并存儲所述音頻幀類;
所述視頻幀數(shù)據(jù)庫,用于分析所述音視頻內容中視頻幀中的對象,以及所述對象對應的總出境率,并存儲相應數(shù)據(jù);
所述情緒監(jiān)測模塊,用于在播放所述音視頻內容時實時檢測觀眾情緒,并且在所述觀眾情緒為目標情緒時獲取疑似音視頻內容;根據(jù)所述疑似音視頻內容更新疑似音頻信息和疑似視頻信息;所述疑似音頻信息包括所述疑似音視頻內容的聲音特征和所述聲音特征的觸發(fā)次數(shù),所述疑似視頻信息包括所述疑似音視頻內容的疑似對象和所述疑似對象的觸發(fā)次數(shù);
所述播放模塊,當所述疑似音頻信息的觸發(fā)次數(shù)大于預設的音頻觀察次數(shù)時,過濾所述音視頻內容中包括所述疑似音頻信息對應的音頻幀類的音視頻內容;當所述疑似視頻信息的觸發(fā)次數(shù)大于預設的視頻觀察次數(shù)時,過濾包括所述疑似視頻信息對應的過濾對象的音視頻內容。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于人民網(wǎng)信息技術有限公司,未經(jīng)人民網(wǎng)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710680389.2/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 內容再現(xiàn)系統(tǒng)、內容提供方法、內容再現(xiàn)裝置、內容提供裝置、內容再現(xiàn)程序和內容提供程序
- 內容記錄系統(tǒng)、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統(tǒng)、內容服務器、內容終端及內容服務方法
- 內容分發(fā)系統(tǒng)、內容分發(fā)裝置、內容再生終端及內容分發(fā)方法
- 內容發(fā)布、內容獲取的方法、內容發(fā)布裝置及內容傳播系統(tǒng)
- 內容提供裝置、內容提供方法、內容再現(xiàn)裝置、內容再現(xiàn)方法
- 內容傳輸設備、內容傳輸方法、內容再現(xiàn)設備、內容再現(xiàn)方法、程序及內容分發(fā)系統(tǒng)
- 內容發(fā)送設備、內容發(fā)送方法、內容再現(xiàn)設備、內容再現(xiàn)方法、程序及內容分發(fā)系統(tǒng)
- 內容再現(xiàn)裝置、內容再現(xiàn)方法、內容再現(xiàn)程序及內容提供系統(tǒng)
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





