[發明專利]智能會議角色分類的方法、裝置、設備及存儲介質在審
| 申請號: | 202010136440.5 | 申請日: | 2020-03-02 |
| 公開(公告)號: | CN111462758A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 熊瑋 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/08;G10L17/00 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 劉挽瀾 |
| 地址: | 518052 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 會議 角色 分類 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能領域,公開了一種智能會議角色分類的方法、裝置、設備及存儲介質,能夠便捷而有效地進行多人會議場景的語音角色分離。本發明方法包括:對會議音頻數據進行分割獲得多個候選音頻數據,多個候選音頻數據中的每個候選音頻數據對應包括一個編號;對多個候選音頻數據中的每個候選音頻數據分別進行斷點識別,獲得目標時間節點;根據目標時間節點從多個候選音頻數據中截取預設時段的第一音頻數據和第二音頻數據;分別對第一音頻數據和第二音頻數據進行特征參數提取,獲得第一特征參數和第二特征參數;將第一特征參數和第二特征參數進行說話人對比分析,獲得目標特征參數;根據預置的角色數據庫和編號確定目標特征參數對應的目標角色。
技術領域
本發明涉及語音信號處理領域,尤其涉及智能會議角色分類的方法、裝置、設備及存儲介質。
背景技術
在傳統的會議模式中,會議記錄等相關的信息需要管理人員進行手工錄入,存在耗時和效率低的問題。為提高會議效率和實現會議紀要的實時發布,采用了智能會議記錄系統。智能會議記錄系統通過麥克風實時接收會議的語音內容,獲得會議語音信息,對語音信息進行語音識別處理以將語音信息轉化為文字信息。
雖然現有的智能會議記錄系統解決了人工手動記錄所帶來的問題,但是對于多人進行對話交談的會議場景中,無法進行語音角色分離,即無法自動識別出語音信息的說話內容對應的具體說話人。
發明內容
本發明提供了一種智能會議角色分類的方法、裝置、設備及存儲介質,旨在實現便捷而有效地進行多人會議場景的語音角色分離。
本發明實施例的第一方面提供一種智能會議角色分類的方法,包括:
獲取會議音頻數據,并對所述會議音頻數據進行分割獲得多個候選音頻數據,所述多個候選音頻數據中的每個候選音頻數據對應包括一個編號;
對所述多個候選音頻數據中的每個候選音頻數據分別進行斷點識別,獲得目標時間節點;
根據所述目標時間節點從所述多個候選音頻數據中截取預設時段的第一音頻數據和第二音頻數據;
分別對所述第一音頻數據和所述第二音頻數據進行特征參數提取,獲得第一特征參數和第二特征參數;
將所述第一特征參數和所述第二特征參數進行說話人對比分析,獲得目標特征參數;
根據預置的角色數據庫和所述編號確定所述目標特征參數對應的目標角色。
可選的,在本發明實施例第一方面的第二種實現方式中,所述對所述多個候選音頻數據中的每個候選音頻數據分別進行斷點識別,獲得目標時間節點,包括:
分別對所述每個候選音頻數據進行重要點檢測,獲得分段數量;
通過預置的時間序列分段算法根據所述分段數量對所述多個候選音頻數據進行分段,得到分段數據,并獲取所述分段數據對應的音頻曲線的轉折點;
獲取所述轉折點的左側相鄰點和右側相鄰點;
根據所述轉折點計算第一斜率和第二斜率,所述第一斜率為所述轉折點與所述左側相鄰點連線的斜率,所述第二斜率為所述轉折點與所述右側相鄰點連線的斜率;
計算所述第一斜率與所述第二斜率的差值;
將所述差值大于第一預設閾值的轉折點作為所述多個候選音頻數據中的目標時間節點。
可選的,在本發明實施例第一方面的第一種實現方式中,所述根據所述目標時間節點從所述多個候選音頻數據中截取預設時段的第一音頻數據和第二音頻數據,包括:
將所述目標時間節點作為末端時間點,根據所述末端時間點從所述多個候選音頻數據中截取預設時段的第一音頻數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010136440.5/2.html,轉載請聲明來源鉆瓜專利網。





