[發明專利]一種實時分角色轉錄方法、設備和系統有效
| 申請號: | 202011477913.4 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112530411B | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 袁斌 | 申請(專利權)人: | 北京快魚電子股份公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/08;G10L15/26;G10L25/03;G10L25/51 |
| 代理公司: | 北京天盾知識產權代理有限公司 11421 | 代理人: | 張彩珍 |
| 地址: | 100093 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 實時 角色 轉錄 方法 設備 系統 | ||
本發明公開了一種實時分角色轉錄方法,包括檢測采集到的左聲道聲音信號和右聲道聲音信號中是否含有語音段,若檢測到語音段,則提取語音段對應的左聲道語音段和右聲道語音段;基于左聲道語音段和右聲道語音段的相位差、幅度差和基頻檢測,判斷單雙側講話;若為單側講話,則判斷說話人是位于左側還是右側;若說話人位于左側,則將左聲道語音段進行聚類形成左側聚類中心;若說話人位于右側,則將右聲道語音段進行聚類形成右側聚類中心;若為雙側講話,則分離左聲道語音段和右聲道語音段中包含的左右側語音信號;并將分離后的左側語音信號和右側語音信號發送至語音識別引擎;該方法能對角色做到準確的分離。本發明還公開了實時分角色轉錄設備及系統。
技術領域
本發明涉及語音識別技術領域,具體涉及一種實時分角色轉錄方法、設備和系統。
背景技術
現如今在一對一的窗口服務過程中,對客服的服務質量要求越來越高,這類場合(比如電信營業廳、汽車4S店)往往是客服和客戶分別位于服務柜臺或窗口的內外側,進行一對一的對話服務活動;現如今對客服的服務質量,包括服務用詞、話務專業術語表達、服務態度、情緒以及是否正確引導客戶均有各種考核,這就需要前端對談話內容做清楚地采集,后端做語音識別等,后端處理一般是使用實時轉錄系統,再通過云端對轉錄后的文本進行整理分析。
目前的前端語音采集常基于深度學習的方案或需要借助前端識別設備;基于深度學習的方案需要一個本地或者云端的語音識別服務器,對實時采集過來的語音流進行語音轉文字轉寫,除了做語音識別之外,往往分角色也需在云端做處理,屬于一種端到端的一站式解決方案,此方案適用的場合并不是雙方的簡易談話這種場景,它一般適用于多個人說話的會議模式;而且該方案對云端或者本地的語音識別引擎硬件配置有較高的要求,角色分類準確度和說話人出現頻率有關,如果在某些場景中,某個說話人只是簡單說了“是”、“好的”這樣的短語,且在整個說話過程中再沒有任何發言,此時角色分類準確度很低,因此,該方案采用大而全的方案解決某些具體問題,其存在無法對本地的具體情況做很具體對應的缺陷。
借助前端識別設備一般采用麥克風陣列形成互為180度的兩個指向,轉錄時需要雙方談話人面對面的講話,設備放在雙方的連線中心上,給人的感覺不友好,這類方案需要監聽兩端采集來的聲音,實時比較兩端的聲音,一般采取選擇實時音量大的方案來決定配成某種角色的語音流;此方案在一些對話場景中能取得一定的效果,但對于說話人同時說話這種場景,往往沒有辦法處理,此方案是通過兩端說話人的能量進行判斷,哪側的音量大則把這段語音歸為哪邊,如果一側并不是語音而是音量很大的噪聲,那么也會把“說話權”誤搶到這側;如果兩端的說話人同時說話,此方案采用的策略是一直選取一側大的聲音保持到結束,這是一種簡易粗暴的行為,該方案沒有較好的估計到這種“同時說話”應該特殊對待的問題,存在無法對“同時說話”進行特殊處理,無法獲取到較好地識別效果的缺陷。
發明內容
針對上述問題,本發明的一個目的是提供一種實時分角色轉錄方法,該方法能實時準確的分清客服和客戶的不同角色對應的語音內容,特別是某個角色對應某段話語,不會張冠李戴;該方法在客服和客戶同時發聲對話的時候(比如搶話、著急表達某些內容、發生不愉快的爭執等),也能對角色做到準確的分離。
本發明的第二個目的是提供一種實時分角色轉錄設備,該設備只拾取雙方的說話聲,對旁邊、遠方或者后方的聲音不拾取,保證了進入聲音的信噪比。
本發明的第三個目的是提供一種實時分角色轉錄系統。
本發明所采用的第一個技術方案是:一種實時分角色轉錄方法,包括以下步驟:
S100:將具有指向性麥克風的聲音采集裝置設置于雙方說話人中間的側面,分別采集得到左聲道聲音信號和右聲道聲音信號;
S200:檢測所述左聲道聲音信號和所述右聲道聲音信號中是否含有語音段,若檢測到語音段,則提取所述語音段對應的左聲道語音段和右聲道語音段;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京快魚電子股份公司,未經北京快魚電子股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011477913.4/2.html,轉載請聲明來源鉆瓜專利網。





