[發(fā)明專利]基于文字識別技術(shù)的筆記生成方法、裝置和計算機(jī)設(shè)備有效
| 申請?zhí)枺?/td> | 201910828605.2 | 申請日: | 2019-09-03 |
| 公開(公告)號: | CN110705233B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 溫桂龍 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06V30/244;G06V30/148;G06V10/82;G06N3/08 |
| 代理公司: | 深圳市明日今典知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 文字 識別 技術(shù) 筆記 生成 方法 裝置 計算機(jī) 設(shè)備 | ||
1.一種基于文字識別技術(shù)的筆記生成方法,應(yīng)用于指定終端,其特征在于,包括:
獲取具有手寫文字和印刷體文字的指定圖片;
利用預(yù)設(shè)的圖片相似度判斷方法,判斷所述指定圖片與所述指定終端前一次獲取的圖片是否相似;
若所述指定圖片與所述指定終端前一次獲取的圖片不相似,則利用預(yù)設(shè)的文字識別技術(shù)將所述指定圖片中的手寫文字和印刷體文字分別識別為手寫文字文本和印刷體文字文本,以及提取所述指定圖片中手寫文字的特征數(shù)據(jù),其中所述特征數(shù)據(jù)至少包括所述手寫文字中的重筆位置與重筆數(shù)量;
將所述特征數(shù)據(jù)輸入基于神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練完成的情緒識別模型,獲得所述情緒識別模型輸出的預(yù)測情緒類別,其中所述情緒識別模型基于預(yù)先采集的手寫文字,以及與所述預(yù)先采集的手寫文字關(guān)聯(lián)的情緒類別組成的樣本數(shù)據(jù)訓(xùn)練而成;
根據(jù)預(yù)設(shè)的情緒類別與文字排版類型的對應(yīng)關(guān)系,獲取與所述預(yù)測情緒類別對應(yīng)的目標(biāo)文字排版類型;
將所述印刷體文字文本和所述手寫文字文本根據(jù)所述目標(biāo)文字排版類型進(jìn)行排版,生成所述筆記。
2.根據(jù)權(quán)利要求1所述的基于文字識別技術(shù)的筆記生成方法,其特征在于,所述利用預(yù)設(shè)的圖片相似度判斷方法,判斷所述指定圖片與所述指定終端前一次獲取的圖片是否相似的步驟,包括:
分別對所述指定圖片與所述指定終端前一次獲取的圖片進(jìn)行灰度化處理得到灰度圖片,所述灰度圖片包括第一灰度圖片和第二灰度圖片;
計算所述灰度圖片的第m列或者第m行的所有像素點(diǎn)的灰度值的平均值A(chǔ)m,以及計算灰度圖片中所有像素點(diǎn)的灰度值的平均值B;
根據(jù)公式:計算灰度圖片的第m列或者第m行的總體方差其中N為所述灰度圖片中的列或者行的總數(shù)量;
根據(jù)公式:獲得所述第一灰度圖片與所述第二灰度圖片的第m列或者第m行的總體方差之差其中,為所述第一灰度圖片的第m列或者第m行的總體方差,為所述第二灰度圖片的第m列或者第m行的總體方差;
判斷是否小于預(yù)設(shè)的方差誤差閾值;
若小于預(yù)設(shè)的方差誤差閾值,則判定所述指定圖片與所述指定終端前一次獲取的圖片相似。
3.根據(jù)權(quán)利要求1所述的基于文字識別技術(shù)的筆記生成方法,其特征在于,所述利用預(yù)設(shè)的圖片相似度判斷方法,判斷所述指定圖片與所述指定終端前一次獲取的圖片是否相似的步驟,包括:
依次對比所述指定圖片與所述指定終端前一次獲取的圖片中對應(yīng)的像素點(diǎn),并統(tǒng)計相同像素點(diǎn)的數(shù)量;
根據(jù)公式:相同像素點(diǎn)占比=所述相同像素點(diǎn)的數(shù)量/所述指定圖片中所有像素點(diǎn)的數(shù)量,獲得所述相同像素點(diǎn)占比;
判斷所述相同像素點(diǎn)占比是否大于預(yù)設(shè)的占比閾值;
若所述相同像素點(diǎn)占比大于預(yù)設(shè)的占比閾值,則判定所述指定圖片與所述指定終端前一次獲取的圖片相似。
4.根據(jù)權(quán)利要求1所述的基于文字識別技術(shù)的筆記生成方法,其特征在于,所述手寫文字的顏色與所述印刷體文字的顏色不同,所述利用預(yù)設(shè)的文字識別技術(shù)將所述指定圖片中的手寫文字和印刷體文字分別識別為手寫文字文本和印刷體文字文本的步驟,包括:
采集所述指定圖片中的像素點(diǎn)的RGB顏色模型中的R顏色通道的數(shù)值、G顏色通道的數(shù)值和B顏色通道的數(shù)值,并根據(jù)預(yù)設(shè)的三值化法將所述指定圖片中的像素點(diǎn)的RGB顏色設(shè)置為(0,0,0)、(255,255,255)或者(P,P,P),其中P為大于0且小于255的預(yù)設(shè)數(shù)值,獲得由三種顏色構(gòu)成的暫時圖片;
計算三種顏色在所述暫時圖片中所占面積,并對面積較小的兩種顏色的所占區(qū)域分別采用預(yù)設(shè)的文字分割方法,獲得分割開的單個手寫文字和分割開的單個印刷體文字;
提取所述單個手寫文字的文字特征和所述單個印刷體文字的文字特征,并輸入預(yù)設(shè)的支持向量機(jī)中進(jìn)行分類,獲得識別而得的手寫文字文本和印刷體文字文本。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910828605.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 防止技術(shù)開啟的鎖具新技術(shù)
- 技術(shù)評價裝置、技術(shù)評價程序、技術(shù)評價方法
- 防止技術(shù)開啟的鎖具新技術(shù)
- 視聽模擬技術(shù)(VAS技術(shù))
- 用于技術(shù)縮放的MRAM集成技術(shù)
- 用于監(jiān)測技術(shù)設(shè)備的方法和用戶接口、以及計算機(jī)可讀存儲介質(zhì)
- 用于監(jiān)測技術(shù)設(shè)備的技術(shù)
- 技術(shù)偵查方法及技術(shù)偵查系統(tǒng)
- 使用投影技術(shù)增強(qiáng)睡眠技術(shù)
- 基于技術(shù)庫的技術(shù)推薦方法





