[發明專利]一種錄音或者錄像文件自動命名的方法和裝置在審
| 申請號: | 201110448111.5 | 申請日: | 2011-12-28 |
| 公開(公告)號: | CN103186557A | 公開(公告)日: | 2013-07-03 |
| 發明(設計)人: | 張元超;程力行;杜永峰;張博學 | 申請(專利權)人: | 宇龍計算機通信科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04N5/92;G10L17/00;G01S19/42 |
| 代理公司: | 深圳市順天達專利商標代理有限公司 44217 | 代理人: | 郭偉剛 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 錄音 或者 錄像 文件 自動 命名 方法 裝置 | ||
1.一種錄音或者錄像文件自動命名的方法,其特征在于,包括以下步驟:
對錄音或者錄像的語音進行聲紋識別,以獲取人物信息;
對錄音或者錄像的語音進行語音識別,以獲取內容信息;
根據所述獲取的信息對錄音或者錄像文件進行自動命名。
2.根據權利要求1所述的方法,其特征在于,還包括:
獲取錄音或者錄像時的時間信息;
獲取錄音或者錄像地點的GPS信息,確定地點信息;以及
對錄像文件視頻幀進行解析,以獲取所述錄像文件中的人物信息和背景信息;
關聯所述背景信息與所述GPS信息,確定所述地點信息。
3.根據權利要求2所述的方法,其特征在于,所述對錄像文件視頻幀進行解析,以獲取人物信息具體包括步驟:
識別出視頻幀中的人物面部技術特征;
將識別出的人物面部技術特征與網絡圖像庫中的人物面部技術特征進行對比,以獲取人物信息。
4.根據權利要求1所述的方法,其特征在于,對錄音或者錄像的語音進行語音識別,以獲取內容信息具體包括步驟:
對錄音或者錄像的語音進行語音識別,獲取預設長度的內容信息;
對所述內容信息進行語義解析,獲取預設長度的語義描述性內容信息。
5.根據權利要求2所述的方法,其特征在于,自動命名的文件名中包括時間信息、地點信息、人物信息以及內容信息中的至少一項信息,優先級從高到低為:人物信息、內容信息、地點信息和時間信息。
6.一種錄音或者錄像文件自動命名的裝置,其特征在于,包括:
人物信息獲取模塊,用于對錄音或者錄像的語音進行聲紋識別,以獲取人物信息;
內容信息獲取模塊,用于對錄音或者錄像的語音進行語音識別,以獲取內容信息;
自動命名模塊,用于根據所述獲取的信息對錄音或者錄像文件進行自動命名。
7.根據權利要求6所述的裝置,其特征在于,該裝置還包括:
時間信息獲取模塊,用于獲取錄音或者錄像時的時間信息;
GPS模塊,用于獲取錄音或者錄像地點的GPS信息;
地點信息確定模塊,用于根據GPS信息確定地點信息;
解析模塊,用于對錄像文件視頻幀進行解析,以獲取所述錄像文件中的人物信息和背景信息;
所述地點信息確定模塊還用于關聯所述背景信息與所述GPS信息,確定所述地點信息。
8.根據權利要求7所述的裝置,其特征在于,所述解析模塊具體用于識別出視頻幀中的人物面部技術特征,并將識別出的人物面部技術特征與網絡圖像庫中的人物面部技術特征進行對比,以獲取人物信息。
9.根據權利要求6所述的裝置,其特征在于,所述內容信息獲取模塊具體用于對錄音或者錄像的語音進行語音識別,獲取預設長度的內容信息;并對所述內容信息進行語義解析,獲取預設長度的語義描述性內容信息。
10.根據權利要求7所述的裝置,其特征在于,所述自動命名模塊所自動命名的文件名中包括時間信息、地點信息、人物信息以及內容信息中的至少一項信息,優先級從高到低為:人物信息、內容信息、地點信息和時間信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于宇龍計算機通信科技(深圳)有限公司,未經宇龍計算機通信科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110448111.5/1.html,轉載請聲明來源鉆瓜專利網。





