[發明專利]語氣識別方法、裝置、電子設備和計算機可讀存儲介質有效

申請號：	201711404907.4	申請日：	2017-12-22
公開（公告）號：	CN108091324B	公開（公告）日：	2021-08-17
發明（設計）人：	謝波	申請（專利權）人：	北京百度網訊科技有限公司
主分類號：	G10L15/02	分類號：	G10L15/02;G10L15/06;G10L15/26
代理公司：	北京清亦華知識產權代理事務所(普通合伙) 11201	代理人：	宋合成
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語氣識別方法裝置電子設備計算機可讀存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種語氣識別方法、裝置、電子設備和計算機可讀存儲介質。其中方法包括：獲取樣本文本；獲取針對樣本文本的多個錄音數據，其中，多個錄音數據是通過使用多種類別語氣朗讀樣本文本而得到的語音；提取多個錄音數據中的語氣特征，并確定語氣特征對應的語氣類別；根據樣本文本、多個錄音數據中的語氣特征和對應的語氣類別，建立語氣識別模型。該方法可以使得每個樣本文本被標注各種類別語氣特征和對應的語氣類別，以便在線上應用中，在對用戶輸入的語音數據進行語音識別的同時，還可以通過預先建立的語氣識別模型對該語音數據進行語氣識別，實現了針對語音數據中各種類別語氣的識別，提高了語音識別效果。

技術領域

本發明涉及語音識別技術領域，尤其涉及一種語氣識別方法、裝置、電子設備和計算機可讀存儲介質。

背景技術

目前有的語音文本相同，但由于用戶講該語音文本時使用了不同的語氣，則導致用戶的意圖大大不同，例如，以文本“真的”為例，用戶可以使用肯定語氣講該文本，還可以使用反問語氣講該文本，由于用戶使用了兩個不同的語氣，所以用戶的意圖也會不同。然而，傳統的語音識別技術，僅能對用戶的語音內容進行識別，而還不能識別出用戶語音的疑問語氣，使得語音識別效果差，從而導致人機語音之間的對話效果差。

發明內容

本發明的目的旨在至少在一定程度上解決上述的技術問題之一。

為此，本發明的第一個目的在于提出一種語氣識別方法。該方法可以使得每個樣本文本被標注各種類別語氣特征和對應的語氣類別，以便在線上應用中，在對用戶輸入的語音數據進行語音識別的同時，還可以通過預先建立的語氣識別模型對該語音數據進行語氣識別，實現了針對語音數據中各種類別語氣的識別，提高了語音識別效果。

本發明的第二個目的在于提出一種語氣識別裝置。

本發明的第三個目的在于提出一種電子設備。

本發明的第四個目的在于提出一種計算機可讀存儲介質。

為達到上述目的，本發明第一方面實施例提出的語氣識別方法，包括：獲取樣本文本；獲取針對所述樣本文本的多個錄音數據，其中，所述多個錄音數據是通過使用多種類別語氣朗讀所述樣本文本而得到的語音；提取所述多個錄音數據中的語氣特征，并確定所述語氣特征對應的語氣類別；根據所述樣本文本、所述多個錄音數據中的語氣特征和對應的語氣類別，建立語氣識別模型。

本發明實施例的語氣識別方法，可通過使用多種類別語氣朗讀樣本文本以得到多個錄音數據，并提取該錄音數據中的語氣特征，并確定該語氣特征對應的語氣類別，最后根據該樣本文本、錄音數據中的語氣特征和對應的語氣類別，建立語氣識別模型，使得每個樣本文本被標注了各種類別語氣特征和對應的語氣類別，以便在線上應用中，在對用戶輸入的語音數據進行語音識別的同時，還可以通過預先建立的語氣識別模型對該語音數據進行語氣識別，實現了針對語音數據中各種類別語氣的識別，提高了語音識別效果，從而可以提高人機語音之間的對話效果，提升了用戶體驗。

為達到上述目的，本發明第二方面實施例提出的語氣識別裝置，包括：第一獲取模塊，用于獲取樣本文本；第二獲取模塊，用于獲取針對所述樣本文本的多個錄音數據，其中，所述多個錄音數據是通過使用多種類別語氣朗讀所述樣本文本而得到的語音；特征提取模塊，用于提取所述多個錄音數據中的語氣特征；確定模塊，用于確定所述語氣特征對應的語氣類別；模型建立模塊，用于根據所述樣本文本、所述多個錄音數據中的語氣特征和對應的語氣類別，建立語氣識別模型。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司，未經北京百度網訊科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201711404907.4/2.html，轉載請聲明來源鉆瓜專利網。