[發明專利]一種語音識別轉化方法及系統有效
| 申請號: | 202010439672.8 | 申請日: | 2019-04-29 |
| 公開(公告)號: | CN111583905B | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 楊彥;羅文華;馬芳 | 申請(專利權)人: | 鹽城工業職業技術學院 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/02;G10L15/22;G10L15/26;G06F16/61;G06F16/683;G06F40/289 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 朱健 |
| 地址: | 224000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 轉化 方法 系統 | ||
本發明提供了一種語音識別轉化方法及系統,所述方法包括如下步驟:獲取待識別的語音數據;根據多個語系數據庫,識別所述語音數據所對應的語系;根據所述語系,從多個語系數據庫中獲取與所述語音數據對應的所述語系數據庫;所述語系數據庫,包括多個語種數據子庫;從多個所述語種數據子庫中獲取與所述語音數據對應的語種;根據文本轉換數據庫,將所述語音數據轉換為所述語種對應的文本數據;提取所述文本數據的關鍵詞數據;獲取所述語音數據中所述關鍵詞數據對應的關鍵詞語音數據,并將所述關鍵詞數據和關鍵詞語音數據存儲到所述文本轉換數據庫中。
技術領域
本發明涉及語音識別技術領域,特別涉及一種語音識別轉化方法及系統。
背景技術
隨著科學技術的不斷發展,語音識別技術已經融入到了人們生活的方方面面。例如,人們在不方便手動輸入文字時,通過將語音數據輸入電子設備,電子設備對語音數據進行自動轉換為文本數據。
但目前,傳統的語音識別技術需要人工設置語音轉換的語種,并不能夠實現將語音數據轉化為與語音數據具有相同語種的文本數據。因此,急需一種語音識別轉化方法及系統。
發明內容
為解決上述技術問題,本發明提供一種語音識別轉化方法及系統,用以實現對語音數據的語種的自動識別,轉化為與語音數據具有相同語種的文本數據。
本發明實施例中提供了一種語音識別轉化方法,所述方法包括如下步驟:
S101、獲取待識別的語音數據;
S102、根據多個語系數據庫,識別所述語音數據所對應的語系;
S103、根據所述語系,從多個語系數據庫中獲取與所述語音數據對應的所述語系數據庫;所述語系數據庫,包括多個語種數據子庫;
S104、從多個所述語種數據子庫中獲取與所述語音數據對應的語種;
S105、根據文本轉換數據庫,將所述語音數據轉換為所述語種對應的文本數據;
S106、提取所述文本數據的關鍵詞數據;
S107、獲取所述語音數據中所述關鍵詞數據對應的關鍵詞語音數據,并將所述關鍵詞數據和關鍵詞語音數據存儲到所述文本轉換數據庫中。
在一個實施例中,多個所述語系數據庫,包括印歐語系數據庫,閃含語系數據庫,阿爾泰語系數據庫,烏拉爾語系數據庫,高加索語系數據庫,漢藏語系數據庫和德拉維達語系數據庫。
在一個實施例中,所述步驟S101、獲取待識別的語音數據之后,所述方法包括:用于對所述語音數據進行預處理;具體步驟包括:
檢測獲取所述語音數據中的靜音區間;
根據所述靜音區間,對所述語音數據進行過濾處理,獲取過濾處理后的語音數據。
在一個實施例中,所述步驟S102、根據多個語系數據庫,識別所述語音數據所對應的語系;具體步驟包括:
獲取所述語音數據的語系數據;具體包括:
將所述語音數據根據語音時長均等的分為兩段子語音數據,并分別提取所述兩段子語音數據的音頻特征,形成兩個語音頻特征矩陣;并通過以下公式(1),獲取語系數據:
其中F為語系數據,(Y1Y2…Yn)為第一段語音音頻特征矩陣,(y1y2…yn)為第二段語音音頻特征矩陣;
并將所述語系數據與多個所述語系數據庫內預設的語系閾值數據進行比對,獲取所述語音數據的所對應的語系;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鹽城工業職業技術學院,未經鹽城工業職業技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010439672.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:脛骨遠端內側接骨板及接骨組件
- 下一篇:金屬板垛夾持裝置及其使用方法





