[發(fā)明專利]一種場景級上下文感知的情感識別深度網(wǎng)絡(luò)方法有效
| 申請?zhí)枺?/td> | 202010664287.3 | 申請日: | 2020-07-10 |
| 公開(公告)號: | CN111985532B | 公開(公告)日: | 2021-11-09 |
| 發(fā)明(設(shè)計)人: | 孫強;張龍濤 | 申請(專利權(quán))人: | 西安理工大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 西安弘理專利事務(wù)所 61214 | 代理人: | 寧文濤 |
| 地址: | 710048 陜*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 場景 上下文 感知 情感 識別 深度 網(wǎng)絡(luò) 方法 | ||
本發(fā)明公開了場景級上下文感知的情感識別深度網(wǎng)絡(luò)方法,通過讀取訓(xùn)練樣本集Xin身體標注值與原始情感標注值,得到身體部位圖像集XB;對Xin和XB歸一化處理后分別送入上、下層卷積神經(jīng)網(wǎng)絡(luò),提取情感特征TF和上下文情感特征TC,將TF和TC分別送入上、下層自適應(yīng)層得到融合權(quán)重λF和λC,將TF、TC、λF和λC融合得到情感融合特征TA,TA經(jīng)全連接層線性映射,得到arousal和valence初始預(yù)測值,衡量兩個初始預(yù)測值與原始情感標注值之間的損失,逐步收斂,完成訓(xùn)練,得到網(wǎng)絡(luò)模型;將測試樣本集處理后送入網(wǎng)絡(luò)模型,獲得測試樣本集Xtn預(yù)測標簽值。本發(fā)明的方法融合特征時考慮到不同屬性的特征對與人物情感的影響程度,在豐富基于圖像的情感識別研究工作的基礎(chǔ)上提高了模型的預(yù)測性能。
技術(shù)領(lǐng)域
本發(fā)明屬于模式識別技術(shù)領(lǐng)域,具體涉及一種場景級上下文感知的情感 識別深度網(wǎng)絡(luò)方法。
背景技術(shù)
情感是人們表達自身感受的一種必要表達形式。在日常生活中,從一個 人所處的實際場景理解并識別他們的情緒有助于感知其精神狀態(tài)和預(yù)測行 為,有效進行互動。早在上世紀90年代,情感計算這一概念已被MIT媒體 實驗室提出,隨后科學(xué)家們就開始致力于將人類的復(fù)雜情感轉(zhuǎn)化為計算機可 以識別的數(shù)值信息,以更好實現(xiàn)人機交互,使計算機趨于智能化,這已成為 人工智能時代亟待解決的關(guān)鍵問題之一。
傳統(tǒng)意義上,針對靜態(tài)圖像的情感識別任務(wù)主要依據(jù)人臉圖像展開研究。 對于人臉圖像,采用預(yù)先定義的特征提取方法進行情感特征提取,并送入分 類器(回歸器)進行模型訓(xùn)練,最終實現(xiàn)情感預(yù)測。然而,基于人臉圖像進 行情感識別容易受到姿態(tài)、光照以及人臉差異等自然環(huán)境與樣本特征因素的 影響。
根據(jù)心理學(xué)研究發(fā)現(xiàn),視覺傳達的情感信息中,人臉圖像傳遞的信息大 約占55%。在日常情感交流中,判斷一個人的情感,不僅可以通過目標人物 的面部表情,還可以通過周圍環(huán)境,如人物動作,與他人互動,所處場景等 一系列豐富的上下文信息對人物內(nèi)心的情感進行估計,甚至在檢測不到人臉 的極端情況下,依然可以通過大量上下文信息對研究對象的情感進行估計。
近年來,基于深度卷積網(wǎng)絡(luò)的復(fù)雜情感識別方法引起關(guān)注,讓網(wǎng)絡(luò)自行 學(xué)習情感特征并進行分析替代了傳統(tǒng)人為定義的方式。但是,當下的深度學(xué) 習分析方法主要針對人臉圖像進行情感分析,缺乏對于自然場景復(fù)雜情形下 人物表現(xiàn)的綜合考慮,未曾考慮場景級上下文信息對于場景中人物情感識別 的影響。同時,對于不同屬性特征的融合方式也研究不足,所建立的模型往 往忽略了不同屬性特征對于情感狀態(tài)識別的貢獻程度。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種場景級上下文感知的情感識別深度網(wǎng)絡(luò)方法, 解決了現(xiàn)有技術(shù)中基于靜態(tài)圖像的情感分析范圍較窄,僅針對人臉圖像,以 及采用直接拼接不同屬性特征的方式進行情感識別的局限性問題。
本發(fā)明所采用的技術(shù)方案是,一種場景級上下文感知的情感識別深度網(wǎng) 絡(luò)方法,具體包括以下步驟:
步驟1、采集圖像,確定訓(xùn)練樣本集Xin和測試樣本集Xtn;
步驟2、讀取訓(xùn)練樣本集Xin中每個樣本的身體標注值與原始情感標注值, 依據(jù)身體標注值提取每個樣本的身體部位,得到身體部位圖像集XB;
步驟3、對訓(xùn)練樣本集Xin進行集合內(nèi)歸一化處理,得到上下文情感圖像 集Xim;對身體部位圖像集XB進行集合內(nèi)歸一化處理,得到歸一化的身體部 位圖像集Xbody;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安理工大學(xué),未經(jīng)西安理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010664287.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于策略的業(yè)務(wù)感知模型及感知方法
- 一種基于分區(qū)感知的無線通信系統(tǒng)頻譜感知方法
- 確定空閑頻段的方法和系統(tǒng)、中心節(jié)點和感知節(jié)點
- 感知無線網(wǎng)絡(luò)的共享協(xié)作頻譜感知方法、感知節(jié)點和匯聚中心
- 感知無線網(wǎng)絡(luò)的協(xié)作頻譜感知方法和感知節(jié)點
- 頻譜感知方法、頻譜感知設(shè)備和數(shù)據(jù)庫
- 基于認知數(shù)據(jù)庫和頻譜感知的頻譜共享方法及裝置
- 一種頂層感知限位組
- 一種自動駕駛汽車用升降式智能感知模塊
- 感知數(shù)據(jù)獲取方法和裝置





