[發明專利]一種多媒體文件檢索的方法和裝置有效
| 申請號: | 201310469487.3 | 申請日: | 2013-10-10 |
| 公開(公告)號: | CN103455642B | 公開(公告)日: | 2017-03-08 |
| 發明(設計)人: | 胡鍇亮 | 申請(專利權)人: | 三星電子(中國)研發中心;三星電子株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京德琦知識產權代理有限公司11018 | 代理人: | 謝安昆,宋志強 |
| 地址: | 210061 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 多媒體 文件 檢索 方法 裝置 | ||
1.一種多媒體文件檢索的方法,其特征在于,所述方法包括:
存儲多媒體文件,其中,所述多媒體文件在捕獲時,嵌入了針對該多媒體文件的描述語音數據;
接收到檢索多媒體文件的語音指令時,識別并分離該語音指令中的動作關鍵詞和需要檢索的多媒體文件的描述關鍵詞;
根據分離出的描述關鍵詞,對存儲的多媒體文件進行匹配;其中,匹配每個多媒體文件時,通過嵌入該多媒體文件的描述語音數據,識別出該多媒體文件的描述關鍵詞;若分離出的描述關鍵詞與識別出的描述關鍵詞匹配,則確定該多媒體文件為匹配的多媒體文件;
根據分離出的動作關鍵詞,對匹配到的多媒體文件執行相應的動作。
2.根據權利要求1所述的方法,其特征在于,
所述針對該多媒體文件的描述語音數據為:預設的缺省語音數據,或,捕獲的發聲者針對該多媒體文件的描述語音數據。
3.根據權利要求1所述的方法,其特征在于,所述多媒體文件在捕獲時,嵌入了針對該多媒體文件的描述語音數據,包括:將針對該多媒體文件的描述語音數據,以擴展數據、元數據、數字水印,或保留數據原始格式的形式,嵌入到捕獲到的多媒體文件中。
4.根據權利要求1-3任意一項所述的方法,其特征在于,所述分離該語音指令中的動作關鍵詞和需要檢索的多媒體文件的描述關鍵詞,之后,所述根據分離出的描述關鍵詞,對存儲的多媒體文件進行匹配,之前,所述方法進一步包括:
確定分離出的描述關鍵詞是否與預設描述關鍵詞匹配,如果是,對接收到的語音指令進行語音特征識別,獲得該語音指令的發聲者的語音特征;使用獲得的發聲者的語音特征,對存儲的多媒體文件進行匹配;其中,匹配每個多媒體文件時,識別出嵌入該多媒體文件的描述語音數據的語音特征;若獲得的發聲者的語音特征與識別出的語音特征匹配,則確定該多媒體文件為匹配的多媒體文件;并根據分離出的動作關鍵詞,對匹配到的多媒體文件執行相應的動作;
否則,執行所述根據分離出的描述關鍵詞,對存儲的多媒體文件進行匹配的步驟及后續步驟。
5.根據權利要求1-3所述的方法,其特征在于,所述分離該語音指令中的動作關鍵詞和需要檢索的多媒體文件的描述關鍵詞時,所述方法進一步包括:對接收到的語音指令進行語音特征識別,獲得該語音指令的發聲者的語音特征;
所述根據分離出的描述關鍵詞,對存儲的多媒體文件進行匹配,之后,所述根據分離出的動作關鍵詞,對匹配到的多媒體文件執行相應的動作,之前,所述方法進一步包括:
使用獲得的發聲者的語音特征,對通過描述關鍵詞匹配到的多媒體文件進行進一步匹配;其中,匹配每個多媒體文件時,識別出嵌入該多媒體文件的描述語音數據的語音特征;若獲得的發聲者的語音特征與識別出的語音數據的語音特征匹配,則確定該多媒體文件為匹配的多媒體文件;
所述根據分離出的動作關鍵詞,對匹配到的多媒體文件執行相應的動作,包括:根據分離出的動作關鍵詞,對通過語音特征匹配到的多媒體文件執行相應的動作。
6.根據權利要求1-3所述的方法,其特征在于,所述分離該語音指令中的動作關鍵詞和需要檢索的多媒體文件的描述關鍵詞時,所述方法進一步包括:對接收到的語音指令進行語音特征識別,獲得該語音指令的發聲者的語音特征;
所述根據分離出的描述關鍵詞,對存儲的多媒體文件進行匹配,之前,所述方法進一步包括:使用獲得的發聲者的語音特征,對存儲的多媒體文件進行匹配;其中,匹配每個多媒體文件時,識別出嵌入該多媒體文件的描述語音數據的語音特征;若獲得的發聲者的語音特征與識別出的語音數據的語音特征匹配,則確定該多媒體文件為匹配的多媒體文件;
其中,根據分離出的描述關鍵詞,對存儲的多媒體文件進行匹配,包括:根據分離出的關鍵詞,在通過語音特征匹配到的多媒體文件中進行匹配。
7.根據權利要求1-3任意一項所述的方法,其特征在于,所述方法進一步包括:
接收到發聲者的語音數據時,進行語音特征識別,獲得該發聲者的語音特征;
對需要確定版權的多媒體文件中嵌入的描述語音數據進行語音特征識別,獲得描述語音數據的語音特征;
確定獲得的發聲者的語音特征與獲得的描述語音數據的語音特征進行匹配;
若獲得的發聲者的語音特征與獲得的描述語音數據的語音特征匹配,則確定該發聲者為該多媒體文件的版權所有者;否則,確定該發聲者不為該多媒體文件的版權所有者。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子(中國)研發中心;三星電子株式會社,未經三星電子(中國)研發中心;三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310469487.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種反射式面向對象仿真引擎
- 下一篇:一種識別微博突發熱點事件的方法及裝置





