[發明專利]一種語音播放紙質書籍內容的方法及裝置有效
| 申請號: | 201410025898.8 | 申請日: | 2014-01-20 |
| 公開(公告)號: | CN103761892A | 公開(公告)日: | 2014-04-30 |
| 發明(設計)人: | 簡文杰;秦偉 | 申請(專利權)人: | 廣東小天才科技有限公司 |
| 主分類號: | G09B5/04 | 分類號: | G09B5/04;G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 胡彬 |
| 地址: | 523860 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 播放 紙質 書籍 內容 方法 裝置 | ||
1.一種語音播放紙質書籍內容的方法,其特征在于,包括:
獲取圖像序列;
判斷所述圖像序列是否與書籍擺放動作或書籍翻頁動作相適配;
如果判斷所述圖像序列與書籍擺放動作相適配,提取并識別所述圖像序列中圖像的封面特征信息,從數據庫中查找與識別結果相匹配的書名內容;在所述書名內容查找成功的情況下,通過發音模塊發出對應于所述書名內容的語音;
如果判斷所述圖像序列與書籍翻頁動作相適配,提取并識別所述圖像序列中圖像的頁面特征信息,從數據庫中查找與識別結果相匹配的頁面內容;在所述頁面內容查找成功的情況下,通過發音模塊發出對應于所述頁面內容的語音。
2.根據權利要求1所述的語音播放紙質書籍內容的方法,其特征在于,所述獲取圖像序列,包括:
控制攝像頭每隔固定時間捕捉一次圖像,得到預設時間長度上或預設捕捉次數下的圖像序列。
3.根據權利要求1所述的語音播放紙質書籍內容的方法,其特征在于,所述提取并識別所述圖像序列中圖像的封面特征信息或頁面特征信息,包括:
從所述圖像序列中查找拍攝時間距離當前時間最近的圖像,并提取所查找到的圖像的封面特征信息或頁面特征信息;
將所提取的封面特征信息或頁面特征信息,與預先存儲的封面特征信息或頁面特征信息進行相似度計算,根據計算結果得到識別結果。
4.根據權利要求1所述的語音播放紙質書籍內容的方法,其特征在于,所述判斷所述圖像序列是否與書籍擺放動作或書籍翻頁動作相適配,包括:
對所述圖像序列中相鄰幀的圖像進行比對,根據所述比對結果判斷所述圖像序列是否與書籍擺放動作或書籍翻頁動作相適配。
5.根據權利要求1所述的語音播放紙質書籍內容的方法,其特征在于,還包括:
在所述書名內容查找失敗的情況下,通過發音模塊發出失敗提示音;
在所述頁面內容查找失敗的情況下,對所述圖像序列中的圖像進行文字識別,得到所述圖像所包含的文字信息,通過發音模塊發出對應于所述文字信息的語音。
6.一種語音播放紙質書籍內容的裝置,其特征在于,包括:
圖像獲取單元,用于獲取圖像序列;
動作判斷單元,用于判斷所述圖像序列是否與書籍擺放動作或書籍翻頁動作相適配;
書名語音播放單元,用于當所述動作判斷單元判斷所述圖像序列與書籍擺放動作相適配時,提取并識別所述圖像序列中圖像的封面特征信息,從數據庫中查找與識別結果相匹配的書名內容;在所述書名內容查找成功的情況下,通過發音模塊發出對應于所述書名內容的語音;
頁面語音播放單元,用于當所述動作判斷單元判斷所述圖像序列與書籍翻頁動作相適配,提取并識別所述圖像序列中圖像的頁面特征信息,從數據庫中查找與識別結果相匹配的頁面內容;在所述頁面內容查找成功的情況下,通過發音模塊發出對應于所述頁面內容的語音。
7.根據權利要求6所述的語音播放紙質書籍內容的裝置,其特征在于,所述圖像獲取單元,具體用于:
控制攝像頭每隔固定時間捕捉一次圖像,得到預設時間長度上或預設捕捉次數下的圖像序列。
8.根據權利要求6所述的語音播放紙質書籍內容的裝置,其特征在于,
所述書名語音播放單元,具體用于:從所述圖像序列中查找拍攝時間距離當前時間最近的圖像,并提取所查找到的圖像的封面特征信息;將所提取的封面特征信息,與預先存儲的封面特征信息進行相似度計算,根據計算結果得到識別結果;或
所述頁面語音播放單元,具體用于:從所述圖像序列中查找拍攝時間距離當前時間最近的圖像,并提取所查找到的圖像的頁面特征信息;將所提取的頁面特征信息,與預先存儲的所有的頁面特征信息進行相似度計算,根據計算結果得到識別結果。
9.根據權利要求6所述的語音播放紙質書籍內容的裝置,其特征在于,所述動作判斷單元,具體用于:
對所述圖像序列中相鄰幀的圖像進行比對,根據所述比對結果判斷所述圖像序列是否與書籍擺放動作或書籍翻頁動作相適配。
10.根據權利要求6所述的語音播放紙質書籍內容的裝置,其特征在于,還包括:
第一失敗處理單元,用于在所述書名內容查找失敗的情況下,通過發音模塊發出失敗提示音;
第二失敗處理單元,用于在所述頁面內容查找失敗的情況下,對所述圖像序列中的圖像進行文字識別,得到所述圖像所包含的文字信息,通過發音模塊發出對應于所述文字信息的語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司,未經廣東小天才科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410025898.8/1.html,轉載請聲明來源鉆瓜專利網。





