[發明專利]基于語音的性別識別方法及其裝置、存儲介質和設備在審
| 申請號: | 201911147316.2 | 申請日: | 2019-11-21 |
| 公開(公告)號: | CN110827800A | 公開(公告)日: | 2020-02-21 |
| 發明(設計)人: | 周瑞 | 申請(專利權)人: | 北京智樂瑟維科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/08;G10L15/26;G10L17/22 |
| 代理公司: | 北京科家知識產權代理事務所(普通合伙) 11427 | 代理人: | 陳娟 |
| 地址: | 100036 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語音 性別 識別 方法 及其 裝置 存儲 介質 設備 | ||
本公開涉及一種基于語音的性別識別方法及其裝置、存儲介質和設備,包括:獲取講話者發聲的待識別的語音文件;提取所述語音文件中數據點的特征數據,所述特征數據為能夠識別所述講話者性別的數據;根據所述特征數據并通過SVM支持向量機分類模型對所述講話者的性別進行識別,并輸出識別結果,以便于判斷出講話者的性別,該方法操作簡單,便于實現,且準確率高,可廣泛應用于基于語音的人機交互領域中。
技術領域
本公開涉及語音處理技術領域,具體地,涉及一種基于語音的性別識別方法及其裝置、存儲介質和設備。
背景技術
在人機交互領域中,對于依賴語音交互的智能機器人應用而言,語音可以提供直接可靠的交互方式。但是在交互過程中,機器人也需要像人一樣,通過語音判斷出對話者的性別,以便給予更切合語境的答復。因此,在基于語音人機交互領域中,通過語音識別出對話人的性別就具有重要的實際意義。通過語音識別出對話者的性別,對語音內容和語種不作限制,故語音性別識別可以被廣泛應用。
發明內容
本公開的目的是提供一種基于語音的性別識別方法及其裝置、存儲介質和設備。
為了實現上述目的,在本公開實施例的第一方面提供一種基于語音的性別識別方法,包括:獲取講話者發聲的待識別的語音文件;提取所述語音文件中數據點的特征數據,所述特征數據為能夠識別所述講話者性別的數據;根據所述特征數據并通過SVM支持向量機分類模型對所述講話者的性別進行識別,并輸出識別結果
可選地,所述SVM分類模型包括:
其中,xi為需要進行性別識別的語音文件內的數據點,x為已知性別的數據點,<xi,x>表示xi和x兩者之間的內積,αi表示SVM分類模型中超平面的支持向量,yi表示語音文件中數據點的特征數據,b表示SVM分類模型中超平面的截距;
其中,αi由下述關系式確定:
其中,<φ(xi),φ(xj)>表示SVM分類模型中語音文件中的數據點到特征空間的映射。
可選地,所述SVM分類模型包括:
所述SVM分類模型由SVM分類算法經過訓練得到。
在本公開實施例的第二方面提供一種基于語音的性別識別裝置,包括:
獲取模塊,用于獲取講話者發聲的待識別的語音文件;
特征數據提取模塊,用于提取所述語音文件中數據點的特征數據,所述特征數據為能夠識別所述講話者性別的數據;
性別識別模塊,用于根據所述特征數據并通過SVM支持向量機分類模型對所述講話者的性別進行識別,并輸出識別結果。
可選地,所述SVM分類模型包括:
其中,xi為需要進行性別識別的語音文件內的數據點,x為已知性別的數據點,<xi,x>表示xi和x兩者之間的內積,αi表示SVM分類模型中超平面的支持向量,yi表示語音文件中數據點的特征數據,b表示SVM分類模型中超平面的截距;
其中,αi由下述關系式確定:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智樂瑟維科技有限公司,未經北京智樂瑟維科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911147316.2/2.html,轉載請聲明來源鉆瓜專利網。





