[發(fā)明專利]一種基于視覺識別的閱讀方法及裝置在審

申請?zhí)枺?/td>	201910023276.4	申請日：	2019-01-10
公開（公告）號：	CN109800748A	公開（公告）日：	2019-05-24
發(fā)明（設(shè)計）人：	曹建明	申請（專利權(quán)）人：	深圳市格萊科技有限公司
主分類號：	G06K9/20	分類號：	G06K9/20
代理公司：	深圳市精英專利事務(wù)所 44242	代理人：	馮筠
地址：	518000 廣東省深圳市光明***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	匹配書籍內(nèi)容特征點圖像視覺識別中間圈存儲集合播放多媒體文件幾何矯正時間成本書籍閱讀圖像識別位置矯正語音內(nèi)容重新排列自動識別坐標(biāo)文件播放閱讀調(diào)取語音書籍
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種基于視覺識別的閱讀方法，其特征在于，包括：

獲取書籍內(nèi)容的圖像；

根據(jù)所述獲取的書籍內(nèi)容的圖像，匹配所述圖像中間圈特征點；

根據(jù)所述匹配得到的所述圖像中間圈特征點，集合所述匹配得到的特征點，存儲所述集合的所述匹配得到的特征點；

對所述存儲的特征點進行圖像識別匹配包括位置矯正、幾何矯正、坐標(biāo)重新排列等，識別匹配出書籍內(nèi)容；

根據(jù)所述識別匹配出的書籍內(nèi)容，播放對應(yīng)所述識別匹配出的書籍內(nèi)容的語音包括從坐標(biāo)文件庫中調(diào)取坐標(biāo)進行對比、點讀判斷和播放多媒體文件等。

2.如權(quán)利要求1所述的基于視覺識別的閱讀方法，其特征在于，所述根據(jù)所述獲取的書籍內(nèi)容的圖像，對所述獲取的書籍內(nèi)容的圖像的圖像特征點進行檢測，檢測得到圖像特征點描述符，根據(jù)所述檢測得到的圖像特征點描述符，匹配所述圖像中間圈特征點，包括：

根據(jù)所述獲取的書籍內(nèi)容的圖像，采用穩(wěn)定特征加速算法，對所述獲取的書籍內(nèi)容的圖像的圖像特征點進行檢測，檢測得到圖像特征點描述符，根據(jù)所述檢測得到的圖像特征點描述符，匹配所述圖像中間圈特征點。

3.如權(quán)利要求1或2所述的基于視覺識別的閱讀方法，其特征在于，所述根據(jù)所述匹配得到的所述圖像中間圈特征點，集合所述匹配得到的特征點，存儲所述集合的所述匹配得到的特征點，包括：

根據(jù)所述匹配得到的所述圖像中間圈特征點，集合所述匹配得到的特征點，采用分割k維數(shù)據(jù)空間的數(shù)據(jù)結(jié)構(gòu)方式，存儲所述集合的所述匹配得到的特征點。

4.如權(quán)利要求3所述的基于視覺識別的閱讀方法，其特征在于，所述對所述存儲的特征點進行圖像識別匹配包括位置矯正、幾何矯正、坐標(biāo)重新排列等，識別匹配出書籍內(nèi)容，包括：

采用K-鄰近算法方式，對所述存儲的特征點進行圖像識別匹配包括位置矯正、幾何矯正、坐標(biāo)重新排列等，識別匹配出書籍內(nèi)容。

5.如權(quán)利要求4所述的基于視覺識別的閱讀方法，其特征在于，所述根據(jù)所述識別匹配出的書籍內(nèi)容，播放對應(yīng)所述識別匹配出的書籍內(nèi)容的語音包括從坐標(biāo)文件庫中調(diào)取坐標(biāo)進行對比、點讀判斷和播放多媒體文件等，包括：

根據(jù)所述識別匹配出的書籍內(nèi)容，采用隨機抽樣一致算法方式，為所述識別匹配出的書籍內(nèi)容配置語音，并播放所述配置的書籍內(nèi)容的語音，播放對應(yīng)所述識別匹配出的書籍內(nèi)容的語音包括從坐標(biāo)文件庫中調(diào)取坐標(biāo)進行對比、點讀判斷和播放多媒體文件等。

6.一種基于視覺識別的閱讀裝置，其特征在于，包括：

獲取模塊、匹配模塊、存儲模塊、識別模塊和播放模塊；

所述獲取模塊，用于獲取書籍內(nèi)容的圖像；

所述匹配模塊，用于根據(jù)所述獲取的書籍內(nèi)容的圖像，匹配所述圖像中間圈特征點；

所述存儲模塊，用于根據(jù)所述匹配得到的所述圖像中間圈特征點，集合所述匹配得到的特征點，存儲所述集合的所述匹配得到的特征點；

所述識別模塊，用于對所述存儲的特征點進行圖像識別匹配包括位置矯正、幾何矯正、坐標(biāo)重新排列等，識別匹配出書籍內(nèi)容；

所述播放模塊，用于根據(jù)所述識別匹配出的書籍內(nèi)容，播放對應(yīng)所述識別匹配出的書籍內(nèi)容的語音包括從坐標(biāo)文件庫中調(diào)取坐標(biāo)進行對比、點讀判斷和播放多媒體文件等。

7.如權(quán)利要求6所述的基于視覺識別的閱讀裝置，其特征在于，所述匹配模塊，具體用于：

8.如權(quán)利要求6或7所述的基于視覺識別的閱讀裝置，其特征在于，所述存儲模塊，具體用于：

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市格萊科技有限公司，未經(jīng)深圳市格萊科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910023276.4/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：醫(yī)療發(fā)票識別方法、用戶設(shè)備、存儲介質(zhì)及裝置
下一篇：一種文字識別方法及裝置

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06K 數(shù)據(jù)識別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理，即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】