[發明專利]應用于數字法庭的語音激勵方法及裝置在審
| 申請號: | 201910140266.9 | 申請日: | 2019-02-26 |
| 公開(公告)號: | CN109859753A | 公開(公告)日: | 2019-06-07 |
| 發明(設計)人: | 王偉;闞海北;單衍景 | 申請(專利權)人: | 北京華夏電通科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L25/78;G06Q50/18 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 王天堯;任默聞 |
| 地址: | 100094 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像數據 音頻數據 實時切換 數字法庭 語音激勵 庭審 采集 圖像信息 音頻信息 自動切換 地被 發言 應用 保證 | ||
本發明公開了一種應用于數字法庭的語音激勵方法及裝置,該方法包括:采集參與庭審的發言者的音頻數據和圖像數據;根據發言者的音頻數據對正在發言的發言者進行識別;根據識別出的發言者的圖像數據,將識別出的發言者的畫面實時切換至激勵畫面中。本發明通過采集參與庭審的發言者的音頻信息和圖像信息,根據發言者的音頻數據對正在發言的發言者進行識別,并根據識別出的發言者的圖像數據,將識別出的發言者的畫面實時切換至激勵畫面中,實現了發言者畫面的自動切換,在保證發言者的畫面能夠準確地被特寫到激勵畫面中的同時,降低了工作人員的勞動強度,提高了對畫面的切換速度。
技術領域
本發明涉及音頻處理技術領域,尤其涉及一種應用于數字法庭的語音激勵方法及裝置。
背景技術
在數字法庭的庭審過程中,會有法官、書記員、原告、被告、證人等角色參與,為了將庭審畫面展示給旁聽席,一般會對每個角色的特寫畫面進行圖像采集,并采用6分割的圖像通過電視展示給旁聽席(6分隔的電視畫面可參見附圖3)。
在此過程中,為了使旁聽人員清楚地看到正在發言的發言人,需要工作人員根據現場的發言情況不斷對各個角色的特寫畫面進行手動切換,使正在發言的發言人的特寫畫面顯示在畫面最大、最清楚的激勵畫面中,如此,不僅增加了工作人員的勞動強度,而且畫面的切換速度較慢。
發明內容
本發明實施例提供一種應用于數字法庭的語音激勵方法,用以在保證發言者的畫面能夠準確地被特寫到激勵畫面中的同時,降低工作人員的勞動強度,提高對畫面的切換速度,該方法包括:
采集參與庭審的發言者的音頻數據和圖像數據;
根據發言者的音頻數據對正在發言的發言者進行識別;
根據識別出的發言者的圖像數據,將識別出的發言者的畫面實時切換至激勵畫面中。
可選的,根據發言者的音頻數據對正在發言的發言者進行識別,包括:
對各個發言者的各路音頻數據進行聲音檢測;
將檢測到有聲音的音頻數據對應的發言者識別為正在發言的發言者。
可選的,對各個發言者的各路音頻數據進行聲音檢測,包括:
每隔預設時長對各路音頻數據進行一次檢測,在預設次數內,如果超過設定次數檢測到有聲音,則認定該路音頻數據有聲音,否則認定該路音頻數據沒有聲音。
可選的,將檢測到有聲音的音頻數據對應的發言者識別為正在發言的發言者,包括:
確定檢測到有聲音的音頻數據對應的音頻源標識;
根據識別出的發言者的圖像數據,將識別出的發言者的畫面實時切換至激勵畫面中,包括:
查找所述音頻源標識對應的發言者的圖像數據,將查找到的圖像數據渲染到參與庭審的發言者的圖像畫面的激勵分割位置中。
可選的,將檢測到有聲音的音頻數據對應的發言者識別為正在發言的發言者,包括:
如果檢測到多路音頻數據有聲音,將優先級最高的音頻數據對應的發言者識別為正在發言的發言者。
本發明實施例還提供一種應用于數字法庭的語音激勵裝置,用以在保證發言者的畫面能夠準確地被特寫到激勵畫面中的同時,降低工作人員的勞動強度,提高對畫面的切換速度,該裝置包括:
數據采集模塊,用于采集參與庭審的發言者的音頻數據和圖像數據;
識別模塊,用于根據發言者的音頻數據對正在發言的發言者進行識別;
語音激勵模塊,用于根據識別出的發言者的圖像數據,將識別出的發言者的畫面實時切換至激勵畫面中。
可選的,識別模塊包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京華夏電通科技有限公司,未經北京華夏電通科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910140266.9/2.html,轉載請聲明來源鉆瓜專利網。





