[發明專利]一種基于聲音的哺乳母豬情緒識別方法在審
| 申請號: | 202011336356.4 | 申請日: | 2020-11-25 |
| 公開(公告)號: | CN112472090A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 楊阿慶;趙慧民;林智勇;劉曉勇;薛月菊;陳榮軍;黃華盛;張磊;韓娜 | 申請(專利權)人: | 廣東技術師范大學 |
| 主分類號: | A61B5/16 | 分類號: | A61B5/16;A61B5/00;G06N3/04;G06N3/08;G10L25/30;G10L25/63 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 馮炳輝 |
| 地址: | 510665 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聲音 哺乳 母豬 情緒 識別 方法 | ||
1.一種基于聲音的哺乳母豬情緒識別方法,其特征在于,包括以下步驟:
1)采集豬欄區域的音頻信號,包括母豬叫聲、仔豬叫聲和設備聲音;
2)采用小波分解與重構除去音頻信號中的仔豬叫聲和設備聲音,得到去噪后的母豬音頻數據,即母豬目標聲音;
3)將母豬目標聲音作為輸入數據輸入預設的情緒識別網絡模型判斷母豬的情緒狀態。
2.根據權利要求1所述的一種基于聲音的哺乳母豬情緒識別方法,其特征在于:在步驟1)中,由于哺乳期母豬和仔豬圈養在一起,因此,音頻數據包括母豬叫聲、仔豬叫聲和設備運作聲,母豬叫聲和仔豬叫聲又統稱為豬只叫聲,豬只叫聲包括母豬和仔豬進食、飲水、睡覺時的聲音,仔豬玩耍打斗時的聲音,母豬和仔豬交互時的聲音。
3.根據權利要求1所述的一種基于聲音的哺乳母豬情緒識別方法,其特征在于,所述步驟2)包括以下步驟:
2.1)對音頻信號選擇小波基函數和分解層數進行小波分解,分解后得到不同尺度的小波分解系數;
2.2)對不同尺度的小波分解系數選擇閾值規則和閾值函數進行閾值處理,消除噪聲在小波域的系數,得到處理后的小波系數,即母豬叫聲信號的估計值;其中,所述閾值函數包括硬閾值和軟閾值,所述閾值規則的選擇有以下情況:
當噪聲與目標聲音重疊少時,選擇固定閾值和啟發式閾值估計規則,能徹底地去除噪聲;當噪聲與目標聲音重疊多時,采用基于Stein的無偏似然估計原理的自適應閾值選擇方法和極大極小閾值選擇方法,能保留更多的目標聲音;
2.3)對處理后的小波系數進行小波重構,得到去噪后的母豬音頻數據,即母豬目標聲音。
4.根據權利要求1所述的一種基于聲音的哺乳母豬情緒識別方法,其特征在于,所述步驟3)包括以下步驟:
3.1)構建訓練數據
3.1.1)按預設切割長度和重疊步長對母豬音頻數據進行切割,得到固定長度的母豬聲音樣本;其中,所述重疊步長不能大于預設切割長度;
3.1.2)對母豬聲音樣本進行情緒標注,用標記“0”表示消極情緒,標記“1”表示積極情緒;
3.1.3)將標記好的母豬聲音樣本按3:1劃分為2份,記為Set1和Set2;其中,所述Set1用于訓練超參的訓練驗證集,Set2是用于訓練網絡參數的驗證集,且Set2中的數據樣本與Set1的數據樣本來源于不同豬欄;
3.2)訓練情緒識別網絡模型
3.2.1)構建用于識別哺乳母豬情緒的網絡結構,所述網絡結構包括輸入層、N個長短期記憶單元、1個全連接層、軟最大分類器層和輸出層;所述輸入層用來自動將輸入音頻按照預設切割長度和重疊步長進行切割;所述長短期記憶單元用于提取所述輸入音頻的時序特征;所述全連接層對所述時序特征進一步進行特征提取和整合,設置全連接層輸出神經元個數為2,則所述時序特征經過全連接層后輸出2個特征值;所述軟最大輸出層以所述2個特征值為輸入,輸出所述2個特征值對應所述情緒類別的概率分布;所述輸出層根據所述概率分布,輸出情緒類別0或1;
3.2.2)設置訓練參數,包括網絡參數和超參;所述網絡參數是需要通過訓練來學習的參數,在進行首次訓練時,網絡參數需要進行初始化,初始化方法為隨機初始化、Xavier初始化、MSRA中的任意一種;所述超參包括學習率、更新器和最大迭代次數;
3.2.3)將訓練數據中帶有情緒類別標記的母豬聲音樣本輸入情緒識別網絡模型,通過前向傳播獲取情緒預測結果,并計算預測結果與該母豬聲音樣本的情緒類別標記之間的損失,從而進行反向傳播更新網絡參數,使預測結果逐漸逼近真實標記,重復前向傳播和反向傳播,直至模型收斂,得到訓練好的情緒識別網絡模型;
其中,上述訓練指的是一次完整的訓練,為了能得到泛化性能好的網絡模型,按照3.1.3)將訓練數據劃分為Set1和Set2份,Set1被隨機劃分為K等份作為K折交叉驗證的訓練驗證集,用于尋找最優超參,Set2用于尋找泛化性能強的網絡參數;
3.2.4)按照步驟2)提取待識別音頻信號中的母豬音頻數據,將待識別的母豬音頻數據輸入訓練好的情緒識別網絡模型中,經過一次前向傳播輸出待識別母豬聲音所對應的情緒類別;其中,待識別的母豬音頻數據輸入情緒識別網絡模型后,按照情緒識別網絡模型輸入層所預設的音頻切割長度和重疊步長將待識別的母豬音頻數據切割為N個子聲音段,之后對每個子聲音段的情緒類別進行判斷,輸出待識別的母豬音頻數據對應的N個子聲音段的情緒類別;
在訓練情緒識別網絡模型之前,按照所述步驟3.1.1)對母豬音頻數據進行切割,得到固定長度的母豬聲音樣本,是為了獲取固定長度聲音樣本對應的情緒類別標記,以便進行情緒識別網絡模型的訓練,在進行母豬聲音情緒預測時不需要單獨進行音頻切割,情緒識別網絡模型已經包括音頻切割操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東技術師范大學,未經廣東技術師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011336356.4/1.html,轉載請聲明來源鉆瓜專利網。





