[發明專利]一種多媒體文件檢索的方法和裝置有效
| 申請號: | 201310469487.3 | 申請日: | 2013-10-10 |
| 公開(公告)號: | CN103455642B | 公開(公告)日: | 2017-03-08 |
| 發明(設計)人: | 胡鍇亮 | 申請(專利權)人: | 三星電子(中國)研發中心;三星電子株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京德琦知識產權代理有限公司11018 | 代理人: | 謝安昆,宋志強 |
| 地址: | 210061 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 多媒體 文件 檢索 方法 裝置 | ||
技術領域
本申請涉及語音處理技術領域,特別涉及一種多媒體文件檢索的方法和裝置。
背景技術
目前,多媒體記錄模塊,如攝像頭,麥克風已經成為個人日常電子設備的標準配置,如相機,手機,平板電腦等等。人們越來越多地使用這些設備記錄生活點滴,也保存了大量的照片,視頻,音頻等多媒體文件。
這些文件一般情況下都以數字序號或者拍攝時間來命名,但是正是這種序號方式的命名使得文件檢索、管理相當地不方便。
例如用戶想檢索某幾張照片,一般需要瀏覽大量照片并從中選擇出所需的幾張,特別是在沒有鼠標鍵盤等通用輸入設備的終端上,例如在TV上檢索照片,只能利用簡單的遙控器來瀏覽檢索照片,相當不方便。
現有實現中,已有某些技術方案用于解決多媒體文件檢索問題,基本上都是通過建立關鍵詞和多媒體文件的映射關系,并將這些映射關系以獨立文件保存或者數據的方式存入數據庫。
這些解決方案的最大缺點在于被檢索的文件和映射關系文件的關系較為松散,并會產生大量的映射文件,對于用戶來說,文件顯得更加雜亂;另外如果被檢索文件如果被更名,可能需要同時更新映射文件或者數據庫;同時將被檢索文件轉存到別的存儲設備或者顯示設備上的時候,需要同時轉存映射文件,或者數據庫文件。
發明內容
有鑒于此,本申請提供一種多媒體文件檢索的方法和裝置,能夠簡單地通過語音進行多媒體文件的檢索,帶來友好的用戶體檢。
為解決上述技術問題,本發明的技術方案是這樣實現的:
一種多媒體文件檢索的方法,所述方法包括:
存儲多媒體文件,其中,所述多媒體文件在捕獲時,嵌入了針對該多媒體文件的描述語音數據;
接收到檢索多媒體文件的語音指令時,識別并分離該語音指令中的動作關鍵詞和需要檢索的多媒體文件的描述關鍵詞;
根據分離出的描述關鍵詞,對存儲的多媒體文件進行匹配;其中,匹配每個多媒體文件時,通過嵌入該多媒體文件的描述語音數據,識別出該多媒體文件的描述關鍵詞;若分離出的描述關鍵詞與識別出的描述關鍵詞匹配,則確定該多媒體文件為匹配的多媒體文件;
根據分離出的動作關鍵詞,對匹配到的多媒體文件執行相應的動作。
一種裝置,該裝置包括:存儲單元、接收單元、識別單元、匹配單元和處理單元;
所述存儲單元,用于存儲多媒體文件,其中,所述多媒體文件在捕獲時,嵌入了針對該多媒體文件的描述語音數據;
所述接收單元,用于接收檢索多媒體文件的語音指令;
所述識別單元,用于當所述接收單元接收到檢索多媒體文件的語音指令時,識別并分離該語音指令中的動作關鍵詞和需要檢索的多媒體文件的描述關鍵詞;
所述匹配單元,用于根據所述識別單元分離出的描述關鍵詞,對所述存儲單元存儲的多媒體文件進行匹配;其中,匹配每個多媒體文件時,通過嵌入該多媒體文件的描述語音數據,識別出該多媒體文件的描述關鍵詞;若分離出的描述關鍵詞與識別出的描述關鍵詞匹配,則確定該多媒體文件為匹配的多媒體文件;
所述處理單元,用于根據所述識別單元分離出的動作關鍵詞,對所述匹配單元匹配到的多媒體文件執行相應的動作。
綜上所述,本申請通過在接收到語音指令時,分離出該語音指令中的動作關鍵詞和描述關鍵詞;使用分離出的描述關鍵詞匹配存儲的嵌入描述語音數據的多媒體文件,若匹配到多媒體文件,根據分離出的動作關鍵詞,對確定為要檢索的多媒體文件執行相應的動作。在不需要保存和維護關鍵詞和多媒體文件的映射關系的情況下,能夠通過語音識別進行多媒體文件的檢索。
附圖說明
圖1為本發明實施例一中檢索多媒體文件的方法流程示意圖;
圖2為本發明實施例二中檢索多媒體文件的方法流程示意圖;
圖3為本發明實施例三中檢索多媒體文件的方法流程示意圖;
圖4為本發明實施例四中檢索多媒體文件的方法流程示意圖;
圖5為本發明實施例五中多媒體文件版權確定方法流程示意圖;
圖6為應用于上述技術的裝置結構示意圖。
具體實施方式
為使本發明的目的、技術方案及優點更加清楚明白,以下參照附圖并舉實施例,對本發明所述方案作進一步地詳細說明。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子(中國)研發中心;三星電子株式會社,未經三星電子(中國)研發中心;三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310469487.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種反射式面向對象仿真引擎
- 下一篇:一種識別微博突發熱點事件的方法及裝置





