[發明專利]關鍵詞檢索方法、系統、移動終端及存儲介質有效
| 申請號: | 202010239637.1 | 申請日: | 2020-03-30 |
| 公開(公告)號: | CN111462777B | 公開(公告)日: | 2023-02-14 |
| 發明(設計)人: | 張廣學;肖龍源;李稀敏;劉曉葳;葉志堅 | 申請(專利權)人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G10L25/54 | 分類號: | G10L25/54;G10L25/03;G10L25/45;G06F16/9032 |
| 代理公司: | 廈門仕誠聯合知識產權代理事務所(普通合伙) 35227 | 代理人: | 吳圳添 |
| 地址: | 361009 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵詞 檢索 方法 系統 移動 終端 存儲 介質 | ||
1.一種關鍵詞檢索方法,其特征在于,所述方法包括:
獲取指定關鍵詞庫中每個指定關鍵詞的指定聲學狀態和指定音素狀態;
根據所述指定聲學狀態對滑窗的窗長進行設置,獲取待檢測語音的當前聲學狀態,并將所述滑窗設置為所述當前聲學狀態;
根據所述滑窗判斷所述待檢測語音中語音段的聲學狀態與所述指定聲學狀態是否匹配;
當判斷到所述語音段的聲學狀態與所述指定聲學狀態匹配時,對所述語音段進行音素狀態轉換,得到當前音素狀態;
根據所述指定音素狀態判斷所述當前音素狀態對應的音素是否是關鍵詞音素;
當判斷到所述當前音素狀態對應的音素是所述關鍵詞音素時,對所述語音段進行關鍵詞標記,并記錄所述語音段的語音位置;
所述根據所述滑窗判斷所述待檢測語音中語音段的聲學狀態與所述指定聲學狀態是否匹配的步驟包括:
根據所述滑窗依序獲取所述待檢測語音中每幀語音幀內所述語音段的語音聲學狀態;
判斷所述語音聲學狀態與所述指定聲學狀態是否相同/相似;
當判斷到所述語音聲學狀態與所述指定聲學狀態相同/相似時,則判定對應所述語音段的聲學狀態與所述指定聲學狀態相匹配;
所述對所述語音段進行音素狀態轉換,得到當前音素狀態的步驟包括:
將所述語音段轉換為拼音,得到拼音串,并對所述拼音串內的輔音音素和元音音素進行分隔;
對所述拼音串中相鄰的音素進行組合,得到待檢測音素對,并對所述待檢測語音進行語音端點檢測,得到端點檢測結果;
根據所述端點檢測結果對所述拼音串中的所述待檢測音素對進行靜音標記,以得到所述當前音素狀態。
2.如權利要求1所述的關鍵詞檢索方法,其特征在于,所述獲取待檢測語音的當前聲學狀態的步驟包括:
獲取待檢測語音的MFCC特征、PITCH特征和IVECTOR特征,并對所述MFCC特征、所述PITCH特征和所述IVECTOR特征進行向量轉換,得到特征向量;
對所述特征向量進行向量合并,得到所述當前聲學狀態。
3.如權利要求1所述的關鍵詞檢索方法,其特征在于,所述根據所述指定聲學狀態對滑窗的窗長進行設置的步驟包括:
計算每個所述指定聲學狀態的長度,并依據最大長度的所述指定聲學狀態設置所述滑窗的窗長。
4.如權利要求1所述的關鍵詞檢索方法,其特征在于,所述根據所述端點檢測結果對所述拼音串中的所述待檢測音素對進行靜音標記的步驟包括:
分別獲取每個所述待檢測音素對末端音素在所述端點檢測結果中對應的靜音時長;
根據所述靜音時長查詢時長標識,并根據所述時長標識對所述待檢測音素對進行時長標記。
5.如權利要求4所述的關鍵詞檢索方法,其特征在于,所述根據所述指定音素狀態判斷所述當前音素狀態對應的音素是否是關鍵詞音素的步驟包括:
將所述指定音素狀態中存儲的指定音素對與所述當前音素狀態中存儲的所述待檢測音素對進行匹配;
當所述指定音素對與所述待檢測音素對匹配成功時,判斷所述指定音素對和所述待檢測音素對上的所述時長標識是否一致;
當判斷到所述時長標識一致時,則判定所述當前音素狀態是所述關鍵詞音素。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門快商通科技股份有限公司,未經廈門快商通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010239637.1/1.html,轉載請聲明來源鉆瓜專利網。





