[發明專利]應用于數字法庭的語音激勵方法及裝置在審

申請號：	201910140266.9	申請日：	2019-02-26
公開（公告）號：	CN109859753A	公開（公告）日：	2019-06-07
發明（設計）人：	王偉;闞海北;單衍景	申請（專利權）人：	北京華夏電通科技有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L25/78;G06Q50/18
代理公司：	北京三友知識產權代理有限公司 11127	代理人：	王天堯;任默聞
地址：	100094 北京市海***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	圖像數據音頻數據實時切換數字法庭語音激勵庭審采集圖像信息音頻信息自動切換地被發言應用保證
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種應用于數字法庭的語音激勵方法及裝置，該方法包括：采集參與庭審的發言者的音頻數據和圖像數據；根據發言者的音頻數據對正在發言的發言者進行識別；根據識別出的發言者的圖像數據，將識別出的發言者的畫面實時切換至激勵畫面中。本發明通過采集參與庭審的發言者的音頻信息和圖像信息，根據發言者的音頻數據對正在發言的發言者進行識別，并根據識別出的發言者的圖像數據，將識別出的發言者的畫面實時切換至激勵畫面中，實現了發言者畫面的自動切換，在保證發言者的畫面能夠準確地被特寫到激勵畫面中的同時，降低了工作人員的勞動強度，提高了對畫面的切換速度。

技術領域

本發明涉及音頻處理技術領域，尤其涉及一種應用于數字法庭的語音激勵方法及裝置。

背景技術

在數字法庭的庭審過程中，會有法官、書記員、原告、被告、證人等角色參與，為了將庭審畫面展示給旁聽席，一般會對每個角色的特寫畫面進行圖像采集，并采用6分割的圖像通過電視展示給旁聽席(6分隔的電視畫面可參見附圖3)。

在此過程中，為了使旁聽人員清楚地看到正在發言的發言人，需要工作人員根據現場的發言情況不斷對各個角色的特寫畫面進行手動切換，使正在發言的發言人的特寫畫面顯示在畫面最大、最清楚的激勵畫面中，如此，不僅增加了工作人員的勞動強度，而且畫面的切換速度較慢。

發明內容

本發明實施例提供一種應用于數字法庭的語音激勵方法，用以在保證發言者的畫面能夠準確地被特寫到激勵畫面中的同時，降低工作人員的勞動強度，提高對畫面的切換速度，該方法包括：

采集參與庭審的發言者的音頻數據和圖像數據；

根據發言者的音頻數據對正在發言的發言者進行識別；

根據識別出的發言者的圖像數據，將識別出的發言者的畫面實時切換至激勵畫面中。

可選的，根據發言者的音頻數據對正在發言的發言者進行識別，包括：

對各個發言者的各路音頻數據進行聲音檢測；

將檢測到有聲音的音頻數據對應的發言者識別為正在發言的發言者。

可選的，對各個發言者的各路音頻數據進行聲音檢測，包括：

每隔預設時長對各路音頻數據進行一次檢測，在預設次數內，如果超過設定次數檢測到有聲音，則認定該路音頻數據有聲音，否則認定該路音頻數據沒有聲音。

可選的，將檢測到有聲音的音頻數據對應的發言者識別為正在發言的發言者，包括：

確定檢測到有聲音的音頻數據對應的音頻源標識；

根據識別出的發言者的圖像數據，將識別出的發言者的畫面實時切換至激勵畫面中，包括：

查找所述音頻源標識對應的發言者的圖像數據，將查找到的圖像數據渲染到參與庭審的發言者的圖像畫面的激勵分割位置中。

可選的，將檢測到有聲音的音頻數據對應的發言者識別為正在發言的發言者，包括：

如果檢測到多路音頻數據有聲音，將優先級最高的音頻數據對應的發言者識別為正在發言的發言者。

本發明實施例還提供一種應用于數字法庭的語音激勵裝置，用以在保證發言者的畫面能夠準確地被特寫到激勵畫面中的同時，降低工作人員的勞動強度，提高對畫面的切換速度，該裝置包括：

數據采集模塊，用于采集參與庭審的發言者的音頻數據和圖像數據；

識別模塊，用于根據發言者的音頻數據對正在發言的發言者進行識別；

語音激勵模塊，用于根據識別出的發言者的圖像數據，將識別出的發言者的畫面實時切換至激勵畫面中。

可選的，識別模塊包括：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京華夏電通科技有限公司，未經北京華夏電通科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910140266.9/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種語音控制方法、裝置、存儲介質及語音聯控系統
下一篇：一種支持語音轉為紅外信號控制設備的智能音箱

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】