[發明專利]一種角色識別智能語音設備有效
| 申請號: | 202110347498.9 | 申請日: | 2021-03-31 |
| 公開(公告)號: | CN113077784B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 熊倩;王宇驍;王政;王學春;蘇遠超 | 申請(專利權)人: | 重慶風云際會智慧科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/04;G10L15/26;G10L21/02 |
| 代理公司: | 重慶強大凱創專利代理事務所(普通合伙) 50217 | 代理人: | 趙玉乾 |
| 地址: | 400000 重慶市璧山區璧泉街道*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 角色 識別 智能 語音 設備 | ||
1.一種角色識別智能語音設備,其特征在于,包括:
采集模塊,用于采集語音會話;
切分模塊,用于對語音會話進行語音識別,在識別完畢后,獲取語音會話的錄音時長,判斷錄音時長與時長閾值的大小,若錄音時長大于時長閾值,對語音會話進行切分,得到多個語音片段;
識別模塊,用于根據預設的語言模型和聲學模型逐個識別語音片段中的說話人身份,并得到說話人的數量;
修正模塊,用于逐個從語音片段中提取說話人的聲音特征,采用聚類算法對聲音特征進行聚類,得到聚類的種類數量,并判斷種類數量與說話人的數量是否相等:如果種類數量與說話人的數量相等,發送輸出說話人身份的指令到輸出模塊;如果種類數量與說話人的數量不相等,發送重新切分的指令到切分模塊;
輸出模塊,用于輸出說話人身份以及對應的語音會話的內容。
2.如權利要求1所述的角色識別智能語音設備,其特征在于,切分模塊還用于,若錄音時長短于時長閾值,復制多份語音會話以使得經過復制后的語音會話的錄音時長大于時長閾值,并對語音會話進行切分以得到多個語音片段。
3.如權利要求2所述的角色識別智能語音設備,其特征在于,識別模塊還用于,將語音片段逐個轉化為文本片段,將文本片段逐個輸入到語言模型中,得到語音片段屬于每個角色時的第一得分;將語音片段逐個輸入到聲學模型中,得到語音片段屬于每個角色時的第二得分;根據第一得分和第二得分,確定語音片段的說話人身份。
4.如權利要求3所述的角色識別智能語音設備,其特征在于,識別模塊還用于在識別語音片段中的說話人身份之前,對語音片段進行增益處理。
5.如權利要求4所述的角色識別智能語音設備,其特征在于,識別模塊還用于在識別語音片段中的說話人身份之前,對語音片段進行回聲消除處理。
6.如權利要求5所述的角色識別智能語音設備,其特征在于,識別模塊還用于在識別語音片段中的說話人身份之前,對語音片段進行降噪處理。
7.如權利要求6所述的角色識別智能語音設備,其特征在于,輸出模塊還用于同步顯示說話人身份以及對應的語音會話的內容。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶風云際會智慧科技有限公司,未經重慶風云際會智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110347498.9/1.html,轉載請聲明來源鉆瓜專利網。





