[發明專利]一種應用于電視場景的音量調節方法有效
| 申請號: | 202011261065.3 | 申請日: | 2020-11-12 |
| 公開(公告)號: | CN112380972B | 公開(公告)日: | 2022-03-15 |
| 發明(設計)人: | 高嵐;謝濤;鄒軍 | 申請(專利權)人: | 四川長虹電器股份有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/774;G06K9/62;H04N21/439;H04N21/4223 |
| 代理公司: | 四川省成都市天策商標專利事務所(有限合伙) 51213 | 代理人: | 陳藝文 |
| 地址: | 621000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 電視 場景 音量 調節 方法 | ||
1.一種應用于電視場景的音量調節方法,其特征在于,包括
步驟S101、實時獲取用戶畫面,調用預先訓練完畢的人臉檢測模型和人臉關鍵點檢測模型對用戶畫面進行檢測識別,得到用戶人臉信息;
步驟S102、根據用戶人臉信息,判斷用戶是否在觀看電視;
若否,則判定用戶未在觀看電視,則返回步驟S101,重新對用戶畫面進行獲取;若是,則進入步驟S103;
步驟S103、對用戶畫面進行單幀處理,計算用戶的位置距離信息和位置角度信息,根據計算結果對電視機的音量進行調節;
通過實時獲取用戶畫面,判斷用戶是否移動位置,若是,則根據用戶位置分別調節兩側喇叭的音量;若否,則進入步驟S104;
步驟S104、對用戶畫面進行多幀處理,檢測用戶當前場景信息,根據所檢測用戶場景信息對電視機的音量進行調節。
2.根據權利要求1所述的方法,其特征在于,所述用戶人臉信息包括人臉位置坐標、人臉關鍵點坐標和姿態角的角度數據。
3.根據權利要求2所述的方法,其特征在于,所述姿態角包括航向角、俯仰角和橫滾角。
4.根據權利要求3所述的方法,其特征在于,所述判斷用戶是否在觀看電視的方法為:預先設置航向角和俯仰角的閾值,當檢測到所述用戶人臉信息的航向角和俯仰角均小于預先設置航向角和俯仰角的閾值時,則判定用戶在觀看電視。
5.根據權利要求1所述的方法,其特征在于,所述方法中,對用戶畫面進行單幀處理時,通過人臉寬度、瞳距與距離之間的比例關系,利用用戶人臉信息計算用戶的位置距離信息。
6.根據權利要求1所述的方法,其特征在于,所述方法中,對用戶畫面進行單幀處理時,通過相機成像原理進行標定獲得用戶的位置角度信息。
7.根據權利要求6所述的方法,其特征在于,通過所述相機成像原理對用戶的位置角度信息進行標定的公式為:
cmos=pix_x/screen_width*camera_x (公式一)
其中,cmos為用戶在相機感光元器件的成像位置;pix_x為用戶在屏幕中顯示的位置;screen_width為屏幕的寬度;camera_x為相機固件中的成像尺寸;
angle=arctan(cmos/J) (公式二)
angle為用戶相對于相機的位置角度;J為相機焦距;
通過上述公式計算出用戶的位置角度信息。
8.根據權利要求1所述的方法,其特征在于,所述方法中,當用戶的場景信息為說話場景時,獲取用戶語音信息,根據所獲取的用戶語音信息判斷用戶是否處于該場景,并根據場景所對應的用戶當前狀態對電視機的音量進行自動調節。
9.根據權利要求1所述的方法,其特征在于,所述人臉關鍵點檢測模型為卷積神經網絡,該神經網絡的訓練過程包括以下步驟:
步驟A、針對神經網絡輸入特點,收集預設數量的人臉圖像樣本;
步驟B、對每一張人臉圖像樣本,通過軟件和人工處理提取出人臉106個關鍵點信息;
步驟C、針對所獲取的圖像樣本及其樣本信息,將其生成tensorflow支持的tfrecord格式的訓練文件和驗證文件;
步驟D、利用訓練文件對模型進行訓練,以生成預先確定的人臉關鍵點檢測模型,并利用驗證文件對生成的人臉關鍵點檢測模型進行驗證;
步驟E、對模型loss至和預設閾值進行比較,若模型loss未下降到預設閾值,則增加人臉圖像樣本,或者調試模型參數,重復步驟A-D;若模型loss下降到預設閾值,或者訓練步數達到一定的步數,則訓練完成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川長虹電器股份有限公司,未經四川長虹電器股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011261065.3/1.html,轉載請聲明來源鉆瓜專利網。





