[發明專利]一種語音音頻篩選系統有效
| 申請號: | 201910339618.3 | 申請日: | 2019-04-25 |
| 公開(公告)號: | CN110134819B | 公開(公告)日: | 2021-04-23 |
| 發明(設計)人: | 王健;蘇戰;王鑫;劉衛平 | 申請(專利權)人: | 廣州智伴人工智能科技有限公司 |
| 主分類號: | G06F16/635 | 分類號: | G06F16/635;G06F16/683 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 朱健;張國香 |
| 地址: | 510000 廣東省廣州市海珠區廣州大道南1*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 音頻 篩選 系統 | ||
本發明提供了一種語音音頻篩選系統,包括:分析模塊,用于對目標語音音頻的語音特征進行分析,獲得目標語音音頻的語音特征;獲取模塊,用于獲取第一語音音頻,并分析第一語音音頻的語音特征;對比模塊,用于比對第一語音音頻的語音特征與目標語音音頻的語音特征,當二者的比對結果滿足預設條件時確定第一語音音頻為可選語音音頻;本語音音頻篩選系統能根據用戶選擇的目標語音音頻篩選出符合要求的第一語音音頻,便于用戶篩選出符合某一部分聽眾喜好的第一語音音頻。
技術領域
本發明涉及篩選音頻技術領域,特別涉及一種語音音頻篩選系統。
背景技術
音頻篩選系統是從若干輸入的音頻中選擇符合用戶需求的音頻,輸入的音頻可以是人們發出的語音,輸入的音頻可以是和用戶預先設置的參數進行對比,也可以是用戶預先選擇一目標音頻,使得輸入的音頻與該目標音頻進行對比,從而根據預設條件判斷輸入的音頻是否符合用戶的需求,最終篩選出符合用戶需求的音頻。
發明內容
本發明提供一種語音音頻篩選系統,用以根據用戶選擇的目標語音音頻篩選出符合要求的第一語音音頻,便于用戶篩選出符合某一部分聽眾喜好的第一語音音頻。
為解決上述技術問題,本發明提出了一種語音音頻篩選系統,包括:
分析模塊,用于對用戶喜歡的目標語音音頻的音頻特征進行分析,獲得所述目標語音音頻的音頻特征;
獲取模塊,用于獲取第一語音音頻,并分析所述第一語音音頻的音頻特征;
對比模塊,用于比對所述第一語音音頻的音頻特征與所述目標語音音頻的音頻特征,當二者的比對結果滿足預設條件時確定所述第一語音音頻為可選語音音頻。
進一步,比對所述第一語音音頻的音頻特征與所述目標語音音頻的音頻特征,當二者的比對結果滿足預設條件時確定所述第一語音音頻為可選語音音頻,具體步驟包括;
確定所述第一語音音頻對應的第一語音音頻特征矩陣,通過以下公式(1),對第一語音音頻進行綜合打分:
其中F為第一語音音頻的綜合得分,(Y1 Y2 … Yn)為第一語音音頻特征矩陣,其中Yi為第一語音音頻的第i個特征的值,(y1 y2 … yn)為目標語音音頻的音頻特征矩陣,yi為目標語音音頻的第i個特征的值,i=1、2、3,…..n,且相同的i所對應的特征為同一類別的特征,為需求解的用戶操作矩陣C;
在求解用戶操作矩陣C時,首先構建一個用戶數據庫,該用戶數據庫中有j條記錄,每條記錄中都包含有所述n個特征對應的值,形成特征矩陣B,特征矩陣B為j行n列的一個矩陣,每一行代表一條記錄,每一列代表一類特征,然后利用公式(2)對矩陣B中的每一個元素進行標準化;
利用公式(2),可以避免矩陣B中出現某個值過大或者過小,導致的計算結果出現誤差,同時避免出現矩陣B中單位對結果可能帶來的差異;
其中bst為矩陣B中的第s行第t列的值,其中s=1、2、3……j,t=1、2、3……n,為bst標準化后的值,為第t列的均值,σt為第t列的方差,對于每一個bst都會通過標準化得到相應的從而可以得到一個新的矩陣B*,為了得到矩陣B*每一列之間的相關性,需要求解矩陣B*中每一列的協方差,形成新的矩陣Cov
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州智伴人工智能科技有限公司,未經廣州智伴人工智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910339618.3/2.html,轉載請聲明來源鉆瓜專利網。





