[發(fā)明專利]將屏幕文字轉(zhuǎn)化為語音的方法及裝置無效

申請?zhí)枺?/td>	201310306697.0	申請日：	2013-07-19
公開（公告）號：	CN103390159A	公開（公告）日：	2013-11-13
發(fā)明（設(shè)計(jì)）人：	羅驍	申請（專利權(quán)）人：	中安消技術(shù)有限公司
主分類號：	G06K9/20	分類號：	G06K9/20;G10L13/08
代理公司：	廣東廣和律師事務(wù)所 44298	代理人：	曹建軍
地址：	100190 北京市海淀區(qū)科學(xué)院***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	屏幕文字轉(zhuǎn)化語音方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明屬于人工智能領(lǐng)域，尤其涉及一種將屏幕文字轉(zhuǎn)化為語音的方法及裝置。

背景技術(shù)

目前智能終端設(shè)備在人們生活當(dāng)中已經(jīng)非常普及，為人們工作生活等各方面帶來各種各樣的資訊信息，極大豐富了人們信息獲取的范圍。智能終端設(shè)備功能日益增多，很多具有將文字轉(zhuǎn)換為語音輸出功能，但是都只是在特定應(yīng)用程序中，并且操作非常不方便。

目前有很多PC和智能手機(jī)上的應(yīng)用軟件（如電子書閱讀器），可以比較好的實(shí)現(xiàn)了將軟件中的頁面文字內(nèi)容朗讀的功能，或者將選中的文字朗讀出來。這類應(yīng)用軟件的實(shí)現(xiàn)方式一般是，在應(yīng)用中觸發(fā)朗讀事件，獲取需要朗讀的文字，然后將文字進(jìn)行語音轉(zhuǎn)換，通過揚(yáng)聲器讀出。這類軟件系統(tǒng)主要缺點(diǎn)在于：基于文字內(nèi)容的轉(zhuǎn)換，無法將屏幕上所看到的圖片內(nèi)的任意文字進(jìn)行轉(zhuǎn)換，其轉(zhuǎn)換的只能是文本格式的內(nèi)容，使得操作不方便，用戶體驗(yàn)度不高。

發(fā)明內(nèi)容

本發(fā)明實(shí)施例的目的在于提供一種將屏幕文字轉(zhuǎn)化為語音的方法和裝置，旨在解決現(xiàn)有的智能終端不能為用戶提供圖片內(nèi)容轉(zhuǎn)化語音的問題。

本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的，一種將屏幕文字轉(zhuǎn)化為語音的方法，所述方法包括：

在終端屏幕上截取待轉(zhuǎn)化的圖片內(nèi)容；

將所述截取的圖片內(nèi)容轉(zhuǎn)換為文字內(nèi)容；

將所述文字內(nèi)容轉(zhuǎn)換為語音信號。

進(jìn)一步地，所述在終端屏幕上截取待轉(zhuǎn)化的圖片內(nèi)容包括：

收到觸發(fā)轉(zhuǎn)化的事件后，彈出遮罩層；

在所述遮罩層的區(qū)域內(nèi)劃取一圖片區(qū)域；

將所述圖片區(qū)域內(nèi)的圖片內(nèi)容保存為位圖對象。

進(jìn)一步地，所述將截取的圖片內(nèi)容轉(zhuǎn)換為文字內(nèi)容包括：

根據(jù)所述位圖對象和預(yù)設(shè)的光學(xué)字符識別算法，獲取所述位圖對象中的文字信息；

對所述文本字符串進(jìn)行語法和語義的分析，得到文本字符串。

進(jìn)一步地，所述將文字內(nèi)容轉(zhuǎn)換為語音信號包括：

根據(jù)所述文本字符串和預(yù)設(shè)的語音識別引擎，生成所述文本字符串對應(yīng)的語音信號。

進(jìn)一步地，所述方法還包括：

播放所述語音信號。

本發(fā)明還提出一種將屏幕文字轉(zhuǎn)化為語音的裝置，所述裝置包括：

圖片截取模塊，用于在終端屏幕上截取待轉(zhuǎn)化的圖片內(nèi)容；

字符識別模塊，用于將所述截取的圖片內(nèi)容轉(zhuǎn)換為文字內(nèi)容；

聲音轉(zhuǎn)換模塊，用于將所述文字內(nèi)容轉(zhuǎn)換為語音信號。

進(jìn)一步地，所述圖片截取模塊包括：

觸發(fā)單元，用于收到觸發(fā)轉(zhuǎn)化的事件后，彈出遮罩層；

劃取單元，用于在所述遮罩層的區(qū)域內(nèi)劃取一圖片區(qū)域；

保存單元，用于將所述圖片區(qū)域內(nèi)的圖片內(nèi)容保存為位圖對象。

進(jìn)一步地，所述字符識別模塊包括：

獲取單元，用于根據(jù)所述位圖對象和預(yù)設(shè)的光學(xué)字符識別算法，獲取所述位圖對象中的文字信息；

分析單元，用于對所述文本字符串進(jìn)行語法和語義的分析，得到文本字符串。

進(jìn)一步地，所述聲音轉(zhuǎn)換模塊具體用于：

根據(jù)所述文本字符串和預(yù)設(shè)的語音識別引擎，生成所述文本字符串對應(yīng)的語音信號。

進(jìn)一步地，還包括：

聲音輸出模塊，用于播放所述語音信號。

在本發(fā)明實(shí)施例中，終端通過鎖定屏幕畫面后，選取需要轉(zhuǎn)換區(qū)域，結(jié)合智能截圖、OCR識別、語音轉(zhuǎn)換等技術(shù)，從而實(shí)現(xiàn)將圖片中的文字轉(zhuǎn)換為語音輸出，尤其適合于視圖障礙者使用，且操作簡便，提高了用戶體驗(yàn)度。

附圖說明

圖1是本發(fā)明實(shí)施例一提供的將屏幕文字轉(zhuǎn)化為語音的方法的流程圖；

圖2是本發(fā)明實(shí)施例二提供的將屏幕文字轉(zhuǎn)化為語音的裝置的結(jié)構(gòu)圖；

圖3是本發(fā)明實(shí)施例二提供的將屏幕文字轉(zhuǎn)化為語音的裝置中圖片截取模塊的結(jié)構(gòu)圖；

圖4是本發(fā)明實(shí)施例二提供的將屏幕文字轉(zhuǎn)化為語音的裝置中字符識別模塊的結(jié)構(gòu)圖。

具體實(shí)施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白，以下結(jié)合附圖及實(shí)施例，對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解，此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明，并不用于限定本發(fā)明。

實(shí)施例一

本發(fā)明實(shí)施例一提出一種將屏幕文字轉(zhuǎn)化為語音的方法。如圖1所示，本發(fā)明實(shí)施例一的方法包括步驟：

步驟S1、在終端屏幕上截取待轉(zhuǎn)化的圖片內(nèi)容；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中安消技術(shù)有限公司，未經(jīng)中安消技術(shù)有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310306697.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06K 數(shù)據(jù)識別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正，例如，用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的，例如，由不同形狀的各個(gè)筆畫組成的，而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理，即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】