[發明專利]基于語音的性別識別方法及其裝置、存儲介質和設備在審
| 申請號: | 201911147316.2 | 申請日: | 2019-11-21 |
| 公開(公告)號: | CN110827800A | 公開(公告)日: | 2020-02-21 |
| 發明(設計)人: | 周瑞 | 申請(專利權)人: | 北京智樂瑟維科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/08;G10L15/26;G10L17/22 |
| 代理公司: | 北京科家知識產權代理事務所(普通合伙) 11427 | 代理人: | 陳娟 |
| 地址: | 100036 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語音 性別 識別 方法 及其 裝置 存儲 介質 設備 | ||
1.一種基于語音的性別識別方法,其特征在于,
獲取講話者發聲的待識別的語音文件;
提取所述語音文件中數據點的特征數據,所述特征數據為能夠識別所述講話者性別的數據;
根據所述特征數據并通過SVM支持向量機分類模型對所述講話者的性別進行識別,并輸出識別結果。
2.根據權利要求1所述的基于語音的性別識別方法,其特征在于,所述SVM分類模型包括:
其中,xi為需要進行性別識別的語音文件內的數據點,x為已知性別的數據點,<xi,x>表示xi和x兩者之間的內積,αi表示SVM分類模型中超平面的支持向量,yi表示語音文件中數據點的特征數據,b表示SVM分類模型中超平面的截距;
其中,αi由下述關系式確定:
其中,i=1,2,...n
其中,<φ(xi),φ(xj)>表示SVM分類模型中語音文件中的數據點到特征空間的映射。
3.根據權利要求2所述的基于語音的性別識別方法,其特征在于,所述SVM分類模型包括:
所述SVM分類模型由SVM分類算法經過訓練得到。
4.一種基于語音的性別識別裝置,其特征在于,包括:
獲取模塊,用于獲取講話者發聲的待識別的語音文件;
特征數據提取模塊,用于提取所述語音文件中數據點的特征數據,所述特征數據為能夠識別所述講話者性別的數據;
性別識別模塊,用于根據所述特征數據并通過SVM支持向量機分類模型對所述講話者的性別進行識別,并輸出識別結果。
5.根據權利要求4所述的基于語音的性別識別裝置,其特征在于,所述SVM分類模型包括:
其中,xi為需要進行性別識別的語音文件內的數據點,x為已知性別的數據點,<xi,x>表示xi和x兩者之間的內積,αi表示SVM分類模型中超平面的支持向量,yi表示語音文件中數據點的特征數據,b表示SVM分類模型中超平面的截距;
其中,αi由下述關系式確定:
其中,i=1,2,...n
其中,<φ(xi),φ(xj)>表示SVM分類模型中語音文件中的數據點到特征空間的映射。
6.根據權利要求5所述的基于語音的性別識別裝置,其特征在于,所述SVM分類模型包括:
所述SVM分類模型由SVM分類算法經過訓練得到。
7.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現權利要求1-3中任一項所述方法的步驟。
8.一種電子設備,其特征在于,包括:
存儲器,其上存儲有計算機程序;
處理器,用于執行所述存儲器中的所述計算機程序,以實現權利要求1-3中任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智樂瑟維科技有限公司,未經北京智樂瑟維科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911147316.2/1.html,轉載請聲明來源鉆瓜專利網。





