[發明專利]基于語音的性別識別方法及其裝置、存儲介質和設備在審

申請號：	201911147316.2	申請日：	2019-11-21
公開（公告）號：	CN110827800A	公開（公告）日：	2020-02-21
發明（設計）人：	周瑞	申請（專利權）人：	北京智樂瑟維科技有限公司
主分類號：	G10L15/02	分類號：	G10L15/02;G10L15/06;G10L15/08;G10L15/26;G10L17/22
代理公司：	北京科家知識產權代理事務所(普通合伙) 11427	代理人：	陳娟
地址：	100036 北京市海***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于語音性別識別方法及其裝置存儲介質設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本公開涉及一種基于語音的性別識別方法及其裝置、存儲介質和設備，包括：獲取講話者發聲的待識別的語音文件；提取所述語音文件中數據點的特征數據，所述特征數據為能夠識別所述講話者性別的數據；根據所述特征數據并通過SVM支持向量機分類模型對所述講話者的性別進行識別，并輸出識別結果，以便于判斷出講話者的性別，該方法操作簡單，便于實現，且準確率高，可廣泛應用于基于語音的人機交互領域中。

技術領域

本公開涉及語音處理技術領域，具體地，涉及一種基于語音的性別識別方法及其裝置、存儲介質和設備。

背景技術

在人機交互領域中，對于依賴語音交互的智能機器人應用而言，語音可以提供直接可靠的交互方式。但是在交互過程中，機器人也需要像人一樣，通過語音判斷出對話者的性別，以便給予更切合語境的答復。因此，在基于語音人機交互領域中，通過語音識別出對話人的性別就具有重要的實際意義。通過語音識別出對話者的性別，對語音內容和語種不作限制，故語音性別識別可以被廣泛應用。

發明內容

本公開的目的是提供一種基于語音的性別識別方法及其裝置、存儲介質和設備。

為了實現上述目的，在本公開實施例的第一方面提供一種基于語音的性別識別方法，包括：獲取講話者發聲的待識別的語音文件；提取所述語音文件中數據點的特征數據，所述特征數據為能夠識別所述講話者性別的數據；根據所述特征數據并通過SVM支持向量機分類模型對所述講話者的性別進行識別，并輸出識別結果

可選地，所述SVM分類模型包括：

其中，x_i為需要進行性別識別的語音文件內的數據點，x為已知性別的數據點，<x_i,x>表示x_i和x兩者之間的內積，α_i表示SVM分類模型中超平面的支持向量，y_i表示語音文件中數據點的特征數據，b表示SVM分類模型中超平面的截距；

其中，α_i由下述關系式確定：

其中，<φ(x_i),φ(x_j)>表示SVM分類模型中語音文件中的數據點到特征空間的映射。

可選地，所述SVM分類模型包括：

所述SVM分類模型由SVM分類算法經過訓練得到。

在本公開實施例的第二方面提供一種基于語音的性別識別裝置，包括：

獲取模塊，用于獲取講話者發聲的待識別的語音文件；

特征數據提取模塊，用于提取所述語音文件中數據點的特征數據，所述特征數據為能夠識別所述講話者性別的數據；