[發明專利]基于助聽器的語音輸出優化方法、服務器及存儲介質在審
| 申請號: | 202010036913.4 | 申請日: | 2020-01-14 |
| 公開(公告)號: | CN111276162A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 林澤珊 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L15/02;G10L15/06;G10L15/08;G06K9/62;G06F16/68;G06F16/635;H04R25/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510000 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 助聽器 語音 輸出 優化 方法 服務器 存儲 介質 | ||
1.一種基于助聽器的語音輸出優化方法,應用于服務器,其特征在于,該方法包括:
分類步驟:根據用戶的屬性信息,利用預設的聚類算法對用戶執行聚類操作得到預設數量的用戶聚類簇;
獲取步驟:獲取預設數量的用戶情緒數據及對應的語音輸入數據,將每個所述用戶情緒數據分別輸入預先訓練的情緒識別模型,得到對應的情緒標簽;
建立步驟:判斷所述情緒標簽是否為預設標簽,若是則利用預先確定的關鍵詞提取算法從所述預設標簽對應的語音輸入數據中提取對應的預設關鍵詞,根據所述用戶聚類簇將所有預設關鍵詞分成預設數量的關鍵詞組,并分別建立與每類用戶對應的預設詞庫存儲至數據庫;及
優化步驟:接收助聽器發出的語音輸出請求,解析所述語音輸出請求得到待輸出語音對應的語音輸入數據及用戶屬性信息,根據所述用戶屬性信息從數據庫中找到對應的預設詞庫,判斷所述語音輸入數據對應的關鍵詞是否存在于預設詞庫,若是則對該語音輸入數據進行數據優化處理得到優化數據,將所述優化數據反饋至所述助聽器。
2.如權利要求1所述的基于助聽器的語音輸出優化方法,其特征在于,所述獲取預設數量的用戶情緒數據及對應的語音輸入數據包括:
通過預設傳感器獲取用戶在第一預設時間段內產生的用戶情緒數據;及/或
通過預設傳感器獲取用戶在第二預設時間段內產生的用戶情緒數據;
其中,所述第一預設時間段的時長小于第二預設時間段的時長;
所述情緒語言包括音頻數據、心率數據及行為數據。
3.如權利要求1所述的基于助聽器的語音輸出優化方法,其特征在于,該方法還包括監督步驟:
接收客戶端發出的用戶情緒數據調用請求,解析所述用戶情緒數據調用請求得到待調用的用戶情緒數據對應的語音輸入數據,及所述用戶情緒數據對應的存儲時間;
將所述語音輸入數據并輸入預先訓練的語境識別模型,輸出語境識別結果;
若所述語境識別結果為第一語境,則將所述用戶情緒數據發送至所述客戶端;或
若所述語境識別結果為第二語境,則拒絕所述客戶端發出的用戶情緒數據調用請求。
4.如權利要求1所述的基于助聽器的語音輸出優化方法,其特征在于,所述情緒識別模型由支持向量機訓練得到,所述情緒識別模型的訓練過程包括:
獲取預設數量的用戶情緒數據樣本,為每一個用戶情緒數據樣本分配唯一的情緒標簽;
將所述用戶情緒數據樣本按照預設比例分成訓練集和驗證集,所述訓練集中的用戶情緒數據樣本數量大于驗證集中的用戶情緒數據樣本數量;
利用預先訓練的特征向量提取模型分別從每個用戶情緒數據樣本中提取出情緒特征向量;
將所述訓練集中的用戶情緒數據樣本輸入所述支持向量機進行訓練,每隔預設周期使用所述驗證集對所述支持向量機進行驗證,利用所述驗證集中各張用戶情緒數據樣本的情緒特征向量和對應的情緒標簽對該情緒識別模型的準確率進行驗證;及
當驗證的準確率大于預設閾值時,結束訓練,得到所述情緒識別模型。
5.如權利要求1-4任一項所述的基于助聽器的語音輸出優化方法,其特征在于,所述情緒特征向量提取模型由MobileNetV2網絡模型訓練得到,所述MobileNetV2網絡模型的網絡結構包括依次連接的53層卷積層、1層池化層以及1層全連接層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于林澤珊,未經林澤珊許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010036913.4/1.html,轉載請聲明來源鉆瓜專利網。





