[發明專利]基于文字記錄的錄像存檔裝置及方法在審
| 申請號: | 201810896152.2 | 申請日: | 2018-08-08 |
| 公開(公告)號: | CN108712624A | 公開(公告)日: | 2018-10-26 |
| 發明(設計)人: | 黃永席;胡淇能 | 申請(專利權)人: | 上海啟諾信息科技有限公司 |
| 主分類號: | H04N5/76 | 分類號: | H04N5/76;H04N7/15;H04N7/18;G10L15/26;G10L17/22;G10L21/0208 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 徐麗 |
| 地址: | 200120 上海市浦東新區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字記錄 發聲位置 音頻信息 聯動控制裝置 存檔裝置 畫面控制 攝像設備 身份信息 視頻信息 存檔 話筒 音像 指令 設備技術領域 壓縮視頻信息 壓縮音頻信息 語音處理模塊 錄像 音視頻會議 存儲成本 存儲模塊 畫面細節 拍攝畫面 設備采集 壓縮處理 音像控制 重要場合 庭審 預設 采集 關聯 記錄 | ||
1.一種基于文字記錄的錄像存檔裝置,其特征在于,包括:音像聯動控制裝置、與所述音像聯動控制裝置相連的第一攝像設備和話筒設備,所述音像聯動控制裝置包括語音處理模塊和存儲模塊;
所述話筒設備,用于采集發言人的音頻信息;
所述語音處理模塊,用于根據所述音頻信息生成文字記錄信息和確定發言人的發聲位置,根據預先存儲的數據進行聲紋識別確定發言人的身份信息,并根據所述發聲位置生成畫面控制指令;
所述第一攝像設備,用于根據所述畫面控制指令將拍攝畫面切換至與所述發聲位置對應的預設位畫面,并采集所述預設位畫面的視頻信息;
所述存儲模塊,用于將所述音頻信息和所述視頻信息進行壓縮處理,并將所述文字記錄信息、所述身份信息與壓縮音頻信息、壓縮視頻信息進行關聯存檔。
2.根據權利要求1所述的裝置,其特征在于,還包括與所述音像聯動控制裝置相連的第二攝像設備;
所述第二攝像設備,用于對全景畫面進行視頻記錄,生成全景視頻信息,并將所述全景視頻信息發送至所述存儲模塊,以使所述存儲模塊將所述全景視頻信息進行壓縮后存檔。
3.根據權利要求1所述的裝置,其特征在于,所述語音處理模塊包括語音轉換模塊和聲紋識別模塊;
所述語音轉換模塊,用于將所述音頻信息進行實時語音轉換,生成文字記錄信息,并根據所述音頻信息檢測音頻波動,確定發言人的所述發聲位置;
所述聲紋識別模塊,用于根據預先存儲的數據對所述音頻信息進行聲紋識別,確定發言人的所述身份信息,并將所述身份信息發送至所述存儲模塊,以使所述存儲模塊根據所述身份信息將所述文字記錄信息進行標記后存檔。
4.根據權利要求1所述的裝置,其特征在于,所述話筒設備包括主話筒和與所述主話筒反向安裝的輔話筒;
所述主話筒,用于采集發言人的原始音頻信息;
所述輔話筒,用于采集發言人的背景音頻信息。
5.根據權利要求4所述的裝置,其特征在于,所述音像聯動控制裝置還包括與所述語音處理模塊相連的過濾模塊;
所述過濾模塊,用于根據聲音頻率將所述原始音頻信息進行對比并過濾,以及,根據所述背景音頻信息將所述原始音頻信息進行對比并過濾。
6.一種基于文字記錄的錄像存檔方法,其特征在于,包括:
采集步驟:采集發言人的音頻信息;
處理步驟:根據所述音頻信息生成文字記錄信息和確定發言人的發聲位置,根據預先存儲的數據進行聲紋識別確定發言人的身份信息,并根據所述發聲位置生成畫面控制指令;
切換步驟:根據所述畫面控制指令將拍攝畫面切換至與所述發聲位置對應的預設位畫面,并采集所述預設位畫面的視頻信息;
存檔步驟:將所述音頻信息和所述視頻信息進行壓縮處理,并將所述文字記錄信息、所述身份信息與壓縮音頻信息、壓縮視頻信息進行關聯存檔。
7.根據權利要求6所述的方法,其特征在于,所述方法還包括:
對全景畫面進行視頻記錄,生成全景視頻信息,并將所述全景視頻信息進行壓縮后存檔。
8.根據權利要求6所述的方法,其特征在于,所述處理步驟包括:
將所述音頻信息進行實時語音轉換,生成文字記錄信息,并根據所述音頻信息檢測音頻波動,確定發言人的所述發聲位置;
根據預先存儲的數據對所述音頻信息進行聲紋識別,確定發言人的所述身份信息,并將所述身份信息發送至所述存儲模塊,以使所述存儲模塊根據所述身份信息將所述文字記錄信息進行標記后存檔。
9.根據權利要求6所述的方法,其特征在于,所述方法還包括:
采集發言人的原始音頻信息和背景音頻信息;
根據聲音頻率將所述原始音頻信息進行對比并過濾,以及,根據所述背景音頻信息將所述原始音頻信息進行對比并過濾。
10.根據權利要求6所述的方法,其特征在于,所述方法還包括:
采用文字檢索的方式在所述文字記錄信息中查找匹配的會議文字記錄,并調閱對應時間軸上的音頻信息和/或視頻信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海啟諾信息科技有限公司,未經上海啟諾信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810896152.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多角度可調節式電視機
- 下一篇:多通道實時高清圖像傳輸系統及傳輸方法





