[發明專利]基于聲紋識別的視頻參數調整方法、裝置及讀存儲介質有效
| 申請號: | 201811586465.4 | 申請日: | 2018-12-21 |
| 公開(公告)號: | CN109448735B | 公開(公告)日: | 2022-05-20 |
| 發明(設計)人: | 付華東 | 申請(專利權)人: | 深圳創維-RGB電子有限公司 |
| 主分類號: | G10L17/22 | 分類號: | G10L17/22;G10L17/08;G10L25/63;H04N21/485 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 胡海國 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 聲紋 識別 視頻 參數 調整 方法 裝置 存儲 介質 | ||
本發明公開了一種基于聲紋識別的視頻參數調整方法,包括:在智能終端播放視頻節目時,接收聲紋數據采集模塊采集的音頻信息;在聲紋特征庫中存在音頻信息對應的目標預設音頻信息時,基于目標預設音頻信息,確定音頻信息對應的用戶身份信息以及用戶心情信息;獲取用戶心情信息對應的參數調整模式的調整參數,以及基于用戶身份信息獲取參數調整模式對應的調整比例;基于調整參數以及調整比例調整智能終端的視頻播放參數。本發明還公開了一種基于聲紋識別的視頻參數調整裝置及可讀存儲介質。本發明能夠根據音頻信息對應的用戶身份信息以及用戶心情信息自動調節智能終端的視頻播放參數,進而實現智能終端的視頻播放參數的智能調節,提高了用戶體驗。
技術領域
本發明涉及是數據處理技術領域,尤其涉及一種基于聲紋識別的視頻參數調整方法、裝置及可讀存儲介質。
背景技術
隨著智能技術的飛速發展,智能電視等智能終端已經進入千家萬戶。由于每個用戶的喜好不一樣,而且每個用戶在不同時刻心情也可能不一樣,不同心情對應的喜好也不一樣,所以人們對智能終端的個性化需求越來越強烈。
目前,智能終端的圖像模式和聲音模式等播放參數的調整大都還是通過用戶手動調整。當用戶心情愉悅時,用戶可能將智能終端的畫面調整的比較亮,聲音也比較大;當用戶心情低落的時候,用戶可能將智能終端的畫面調整的比較暗,聲音也可能比較小。并且,對于老人、大人、小孩子等不同年齡的用戶,在相同心情下,對圖像模式和聲音模式等播放參數的需求也不一樣。
但是,在用戶的心情不同時,智能終端的播放參數只能通過用戶進行手動調整,而不能根據用戶的身份以及心情進行自動調節,導致播放參數的調整過程不夠智能,缺乏人性化,影響用戶體驗。
上述內容僅用于輔助理解本發明的技術方案,并不代表承認上述內容是現有技術。
發明內容
本發明的主要目的在于提供一種基于聲紋識別的視頻參數調整方法、裝置及可讀存儲介質,旨在解決智能終端的播放參數不能根據用戶的身份以及心情進行自動調節的技術問題。
為實現上述目的,本發明提供一種基于聲紋識別的視頻參數調整方法,所述基于聲紋識別的視頻參數調整方法包括以下步驟:
在智能終端播放視頻節目時,接收聲紋數據采集模塊采集的音頻信息;
在聲紋特征庫中存在所述音頻信息對應的目標預設音頻信息時,基于所述目標預設音頻信息,確定所述音頻信息對應的用戶身份信息以及用戶心情信息;
獲取所述用戶心情信息對應的參數調整模式的調整參數,以及基于所述用戶身份信息獲取所述參數調整模式對應的調整比例;
基于所述調整參數以及調整比例調整所述智能終端的視頻播放參數。
進一步地,所述在聲紋特征庫中存在所述音頻信息對應的目標預設音頻信息時,基于所述目標預設音頻信息,確定所述音頻信息對應的用戶身份信息以及用戶心情信息的步驟包括:
確定所述音頻信息對應的聲紋特征向量;
確定聲紋特征庫的預設音頻信息對應的預設特征向量中,是否存在與所述聲紋特征向量匹配的目標特征向量;
若存在,則基于目標特征向量對應的目標預設音頻信息,確定所述音頻信息對應的用戶心情信息。
進一步地,所述確定聲紋特征庫的預設音頻信息對應的預設特征向量中,是否存在與所述聲紋特征向量匹配的目標特征向量的步驟包括:
計算所述聲紋特征庫中各個預設音頻信息對應的預設特征向量,與所述聲紋特征向量之間的第一相似度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳創維-RGB電子有限公司,未經深圳創維-RGB電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811586465.4/2.html,轉載請聲明來源鉆瓜專利網。





