[發(fā)明專利]基于表情的背景音樂(lè)控制方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201210268505.7 | 申請(qǐng)日: | 2012-07-30 |
| 公開(kāi)(公告)號(hào): | CN102750964A | 公開(kāi)(公告)日: | 2012-10-24 |
| 發(fā)明(設(shè)計(jì))人: | 郭雷;陳智慧;趙天云 | 申請(qǐng)(專利權(quán))人: | 西北工業(yè)大學(xué) |
| 主分類號(hào): | G11B19/02 | 分類號(hào): | G11B19/02;G06K9/00 |
| 代理公司: | 西北工業(yè)大學(xué)專利中心 61204 | 代理人: | 王鮮凱 |
| 地址: | 710072 *** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 表情 背景音樂(lè) 控制 方法 裝置 | ||
1.一種基于表情的背景音樂(lè)控制方法,其特征在于步驟如下:
步驟1:將采集的人臉24位真彩色圖像進(jìn)行灰度化處理,灰度化算法采用加權(quán)平均值法:f(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j);式中:f(i,j)為轉(zhuǎn)換后的灰度圖像在(i,j)處的灰度值,R(i,j)為原圖像在(i,j)處的R分量灰度值,G(i,j)為原圖像在(i,j)處的G分量灰度值,B(i,j)為原圖像在(i,j)處的B分量灰度值;
步驟2:利用積分圖像算法提取灰度化處理后圖像的Haar特征,將提取的圖像Haar特征通過(guò)級(jí)聯(lián)分類器來(lái)檢測(cè)圖像中的人臉區(qū)域;所述級(jí)聯(lián)分類器是利用樣本圖像的人臉Haar特征,采用AdaBoost分類算法進(jìn)行分類器訓(xùn)練后得到的;
步驟3:設(shè)人臉區(qū)域的高度為h,寬度為w,取左上角點(diǎn)為原點(diǎn),取兩眼窗的起始坐標(biāo)為:左眼右眼兩眼窗的大小為
步驟4:對(duì)兩眼窗內(nèi)區(qū)域的圖像做直方圖分析,留取灰度最低的5%像素,其余部分灰度值置為255,然后將窗內(nèi)圖像作水平投影,得到一條一維曲線;一維曲線上出現(xiàn)的兩個(gè)波谷自上而下分別代表眉毛區(qū)域和眼睛區(qū)域,眼睛區(qū)域波谷的谷點(diǎn)位置作為眼睛的縱坐標(biāo);所述窗內(nèi)圖像水平投影函數(shù)為:式中I(x,y)為在(x,y)點(diǎn)的灰度值,N為投影像素點(diǎn)數(shù);
步驟5:將眉毛區(qū)域的灰度值置為255,然后將兩眼窗內(nèi)圖像做垂直投影,得到一條一維曲線,曲線左右波峰的峰點(diǎn)位置作為左右眼睛的橫坐標(biāo);所述垂直投影函數(shù)為:式中I(x,y)為在(x,y)點(diǎn)的灰度值,N為投影像素點(diǎn)數(shù);
步驟6:連接步驟4和步驟5得到的兩眼坐標(biāo),以兩眼坐標(biāo)的連線中點(diǎn)作為坐標(biāo)原點(diǎn),建立人臉圖像坐標(biāo)系,旋轉(zhuǎn)人臉圖像使雙眼為水平位置;
步驟7:根據(jù)人臉的面部比例特征確定嘴巴的位置并取嘴巴窗,嘴巴窗的起始坐標(biāo)為窗的大小為將嘴巴窗內(nèi)圖像做水平投影,取投影所得的曲線的最小值作為嘴巴在垂直方向上的坐標(biāo);設(shè)兩眼之間距離為k,兩眼中心到嘴巴的距離為g,以兩眼距離中心為中心,左右取向上取往下取得到一個(gè)切割后的人臉圖像;
步驟8:將人臉圖像放縮到100×100像素,得到人臉圖像的二維矩陣M[k][g],其中k=100,g=100;對(duì)二維矩陣灰度歸一化處理,得到具有相同的均值和方差的人臉圖像;所述灰度歸一化處理公式:式中μ0和σ0是變換后圖像的均值和標(biāo)準(zhǔn)差,和是變換前圖像的均值和標(biāo)準(zhǔn)差;
步驟9:取像素點(diǎn)數(shù)寬為P,長(zhǎng)為L(zhǎng)的采樣窗,滑動(dòng)步長(zhǎng)為4×4,從左到右,從上向下在步驟8處理后的人臉圖像上滑動(dòng),獲取采樣圖像塊,然后,對(duì)于每個(gè)圖像塊采用8點(diǎn)的二維離散余弦變換公式進(jìn)行變換,
式中M=N=8,
得到二維離散余弦變換系數(shù)C(u,v)取變換系數(shù)的低頻部分4×4系數(shù)作為嵌入式隱馬爾可夫模型的觀察向量序列;所述P×L為16×16;
步驟13:使用前向-后向算法Forward-Backward?Algorithm,將步驟9中得到的觀察向量序列分別與訓(xùn)練完成的“快樂(lè)”“正常”“難過(guò)”三種表情的嵌入式隱馬爾可夫模型觀察向量序列的似然概率值,選擇似然概率值最高的模型作為采集圖像中人臉的表情信息所屬類別;
所述訓(xùn)練“快樂(lè)”“正常”“難過(guò)”三種表情的嵌入式隱馬爾可夫模型的步驟:
“快樂(lè)”的嵌入式隱馬爾可夫模型訓(xùn)練:選擇“快樂(lè)”表情的樣本圖像,其中“快樂(lè)”表情指6種基本表情中驚奇和高興的表情;取超級(jí)狀態(tài)的個(gè)數(shù)為5,分別是額頭、眼睛、鼻子、嘴和下巴五大部分;將超級(jí)狀態(tài)中嵌入狀態(tài)的個(gè)數(shù)定義為{3,5,3,5,3},訓(xùn)練“快樂(lè)”表情的嵌入式隱馬爾可夫模型;
“難過(guò)”的嵌入式隱馬爾可夫模型訓(xùn)練:選擇“難過(guò)”表情的樣本圖像,其中“難過(guò)”表情指6種基本表情中憤怒和悲傷的表情;取超級(jí)狀態(tài)的個(gè)數(shù)為5,分別是額頭、眼睛、鼻子、嘴和下巴五大部分;將超級(jí)狀態(tài)中嵌入狀態(tài)的個(gè)數(shù)定義為{3,5,3,5,3},訓(xùn)練“難過(guò)”表情的嵌入式隱馬爾可夫模型;
“正常”的嵌入式隱馬爾可夫模型訓(xùn)練:選擇“正常”表情的樣本圖像,其中“正常”表情指不包括在“快樂(lè)”和“難過(guò)”表情中的其他表情;取超級(jí)狀態(tài)的個(gè)數(shù)為5,分別是額頭、眼睛、鼻子、嘴和下巴五大部分;將超級(jí)狀態(tài)中嵌入狀態(tài)的個(gè)數(shù)定義為{3,5,3,5,3},訓(xùn)練“正常”表情的嵌入式隱馬爾可夫模型;
所述三種表情的樣本圖像選自卡內(nèi)基梅隆大學(xué)的Cohn-Kanade表情數(shù)據(jù)庫(kù);
步驟14:當(dāng)識(shí)別的表情信息所屬類別為“快樂(lè)”時(shí),將背景音樂(lè)提高音量5分貝,加大重低音3分貝,提高高音3分貝,開(kāi)啟環(huán)繞聲;
當(dāng)識(shí)別的表情信息所屬類別為“正常”時(shí),將背景音樂(lè)降低音量至45分貝,降低重低音至30分貝,降低高音至25分貝,開(kāi)啟環(huán)繞聲;
當(dāng)識(shí)別的表情信息所屬類別為“難過(guò)”時(shí),將背景音樂(lè)降低音量5分貝,關(guān)閉重低音,降低高音至20分貝,關(guān)閉環(huán)繞聲。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學(xué),未經(jīng)西北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210268505.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種多功能清潔用具
- 下一篇:一種可伸縮的三角形拐杖
- 同類專利
- 專利分類
G11B 基于記錄載體和換能器之間的相對(duì)運(yùn)動(dòng)而實(shí)現(xiàn)的信息存儲(chǔ)
G11B19-00 并非專用于細(xì)絲或薄片形記錄載體或具有支承物的記錄載體的驅(qū)動(dòng)、起動(dòng)、停動(dòng);它們的控制;操作功能的控制
G11B19-02 .操作功能的控制,例如,從記錄到重現(xiàn)的切換
G11B19-20 .驅(qū)動(dòng);起動(dòng);停動(dòng);及其控制
G11B19-22 ..除速度調(diào)節(jié)制動(dòng)器外的其他制動(dòng)器
G11B19-24 ..記錄載體和換能頭之間給出恒定相對(duì)速度的裝置
G11B19-26 ..變速裝置;反向裝置;及其驅(qū)動(dòng)傳送裝置
- 獲取表情含義的方法和裝置
- 合成臉部表情圖像的方法和裝置
- 用于移動(dòng)終端的圖形用戶界面
- 表情識(shí)別方法、裝置、終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于微表情的圖像識(shí)別方法、裝置以及相關(guān)設(shè)備
- 三維動(dòng)畫角色表情生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 表情問(wèn)答庫(kù)的構(gòu)建方法、表情搜索方法、裝置及存儲(chǔ)介質(zhì)
- 一種基于重構(gòu)跨域視頻生成對(duì)抗網(wǎng)絡(luò)模型的微表情識(shí)別方法
- 一種虛擬角色表情展現(xiàn)的方法和裝置
- 表情包的處理方法、裝置及智能設(shè)備
- 一種背景音樂(lè)播放方法
- 為短信提供背景音樂(lè)的方法及其實(shí)現(xiàn)裝置
- 獲取播放視頻中背景音樂(lè)信息的方法、裝置及系統(tǒng)
- 背景音樂(lè)的處理方法和裝置
- 一種背景音樂(lè)切換方法和裝置
- 一種在通話過(guò)程中播放背景音樂(lè)的方法、裝置和移動(dòng)終端
- 背景音樂(lè)控制設(shè)備、云端服務(wù)器和背景音樂(lè)控制系統(tǒng)
- 背景音樂(lè)的播放方法、設(shè)備、客戶端裝置及電子設(shè)備
- 一種背景音樂(lè)構(gòu)建方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 針對(duì)短視頻的音樂(lè)識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





