[發明專利]語音識別文本的標點預測方法、系統、終端及存儲介質在審
| 申請號: | 201911099002.X | 申請日: | 2019-11-11 |
| 公開(公告)號: | CN110827825A | 公開(公告)日: | 2020-02-21 |
| 發明(設計)人: | 陳昊亮;許敏強;楊世清 | 申請(專利權)人: | 廣州國音智能科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/02;G10L15/06;G10L25/63;G06F40/279;G06F40/289;G06F40/30 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 晏波 |
| 地址: | 510000 廣東省廣州市黃埔*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 文本 標點 預測 方法 系統 終端 存儲 介質 | ||
本發明公開了一種語音識別文本的標點預測方法、系統、終端及存儲介質,方法包括:通過接收用戶輸入的語音數據;對語音數據進行語音識別,以獲得相應的文本內容;根據預設語氣識別模型對語音數據進行語氣識別,以獲得相應的語氣類型;根據語氣類型確定文本內容的句尾的標點符號。這樣,根據語氣類型確定文本內容的句尾的標點符號,從而使得標點生成結果更準確。
技術領域
本發明涉及語音識別技術領域,尤其涉及一種語音識別文本的標點預測方法、系統、終端及存儲介質。
背景技術
隨著語音識別技術的發展,人們越來越重視語音識別結果的準確率。因此,為了提高語音識別結果的準確率,人們還會關注標點符號對語音識別結果的影響。因此,語音識別文本預測標點位置以及標點類型,已經成為語音識別系統的重要組成部分。
但是,現有技術中的標點預測方法在語音識別文本預測標點時,生成的文本內容的標點結果往往不準確。
發明內容
本發明的主要目的在于提供一種語音識別文本的標點預測方法、系統、終端及存儲介質,旨在解決現有技術中的標點生成結果不準確的技術問題。
為實現上述目的,本發明提供一種語音識別文本的標點預測方法,所述語音識別文本的標點預測方法包括:
接收用戶輸入的語音數據;
對所述語音數據進行語音識別,以獲得相應的文本內容;
根據預設語氣識別模型對所述語音數據進行語氣識別,以獲得相應的語氣類型;
根據所述語氣類型確定所述文本內容的句尾的標點符號。
進一步地,,所述根據預設語氣識別模型對所述語音數據進行語氣識別,以獲得相應的語氣類型的步驟之前,包括:
獲取多個訓練語音數據;
提取多個所述訓練語音數據中的句尾的語調特征,并確定所述句尾的語調特征對應的所述語氣類型;
根據多個所述訓練語音數據中的句尾的語調特征和對應的所述語氣類型,以構建所述預設語氣識別模型。
進一步地,所述根據預設語氣識別模型對所述語音數據進行語氣識別,以獲得相應的語氣類型的步驟,包括:
構建所述預設語氣識別模型;
將所述語音數據作為輸入集,并將所述輸入集輸入所述預設語氣識別模型進行語氣識別,以獲得相應的所述語氣類型。
進一步地,所述語氣類型包括陳述語氣、感嘆語氣和疑問語氣,所述根據所述語氣類型確定所述文本內容的句尾的標點符號的步驟,包括:
若所述語氣類型是所述陳述語氣時,則判定所述文本內容的句尾的標點符號是預設句號;
若所述語氣類型是所述感嘆語氣時,則判定所述文本內容的句尾的標點符號是預設感嘆號;
若所述語氣類型是所述疑問語氣時,則判定所述文本內容的句尾的標點符號是預設問號。
進一步地,所述根據所述語氣類型確定所述文本內容的句尾的標點符號的步驟之后,包括:
根據所述文本內容的語義,對所述文本內容的句尾的標點符號進行修正。
進一步地,所述根據所述文本內容的語義,對所述文本內容的句尾的標點符號進行修正的步驟,包括:
提取所述文本內容的關鍵字,
根據所述關鍵字與所述文本內容之間的上下文關系,以獲得參考標點符號;
若所述參考標點符號與所述文本內容的句尾的標點符號不匹配時,則判定所述文本內容的情感傾向;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州國音智能科技有限公司,未經廣州國音智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911099002.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種耐低溫鋰離子電池電解液和一種鋰離子電池
- 下一篇:一種數控成形砂輪磨齒機





