[發(fā)明專利]文本審核方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110964902.7 | 申請(qǐng)日: | 2021-08-23 |
| 公開(公告)號(hào): | CN113420757B | 公開(公告)日: | 2021-11-30 |
| 發(fā)明(設(shè)計(jì))人: | 鄧博洋 | 申請(qǐng)(專利權(quán))人: | 北京每日優(yōu)鮮電子商務(wù)有限公司 |
| 主分類號(hào): | G06K9/20 | 分類號(hào): | G06K9/20;G06K9/32;G06K9/34;G06K9/62;G06F40/106;G06F40/279;G06N3/04;G06N3/08 |
| 代理公司: | 北京唯智勤實(shí)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11557 | 代理人: | 陳佳 |
| 地址: | 100102 北京市朝陽(yáng)區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 審核 方法 裝置 電子設(shè)備 計(jì)算機(jī) 可讀 介質(zhì) | ||
本公開的實(shí)施例公開了文本審核方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)。該方法的一具體實(shí)施方式包括:生成目標(biāo)圖像對(duì)應(yīng)的熱力圖;根據(jù)熱力圖,對(duì)目標(biāo)圖像進(jìn)行圖像分割,以生成區(qū)域圖像集合;對(duì)區(qū)域圖像集合中的每個(gè)區(qū)域圖像進(jìn)行文本方向檢測(cè),以生成區(qū)域圖像對(duì)應(yīng)的文本方向信息;根據(jù)熱力圖和區(qū)域圖像集合中每個(gè)區(qū)域圖像對(duì)應(yīng)的文本方向信息,對(duì)區(qū)域圖像進(jìn)行細(xì)化分割,以生成子圖像,得到子圖像集合;對(duì)子圖像集合中的每個(gè)子圖像進(jìn)行文本識(shí)別,以生成文本信息,得到文本信息集合;對(duì)文本信息集合中的每個(gè)文本信息進(jìn)行敏感詞匹配,以生成文本審核結(jié)果,得到文本審核結(jié)果集合。該實(shí)施方式提高了文本識(shí)別的準(zhǔn)確率和文本審核的準(zhǔn)確率。
技術(shù)領(lǐng)域
本公開的實(shí)施例涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及文本審核方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù)
文本審核是指對(duì)物品對(duì)應(yīng)的展示信息中的內(nèi)容,進(jìn)行審核的一項(xiàng)技術(shù)。目前,在對(duì)物品對(duì)應(yīng)的展示信息進(jìn)行文本審核時(shí),通常采用的方式為:采用人工的方式進(jìn)行文本審核。
然而,當(dāng)采用上述方式進(jìn)行文本審核時(shí),經(jīng)常會(huì)存在如下技術(shù)問(wèn)題:
第一、隨著待審核的物品對(duì)應(yīng)的展示信息的數(shù)量增加,采用人工的方式,會(huì)消耗大量的審核成本,同時(shí)審核效率難以提高;
第二、由于物品對(duì)應(yīng)的展示信息中的文本的排列方向往往不同,采用單一方向的文本識(shí)別方法,往往會(huì)導(dǎo)致得到的文本識(shí)別結(jié)果不夠準(zhǔn)確,進(jìn)而導(dǎo)致文本審核的準(zhǔn)確率不高。
發(fā)明內(nèi)容
本公開的內(nèi)容部分用于以簡(jiǎn)要的形式介紹構(gòu)思,這些構(gòu)思將在后面的具體實(shí)施方式部分被詳細(xì)描述。本公開的內(nèi)容部分并不旨在標(biāo)識(shí)要求保護(hù)的技術(shù)方案的關(guān)鍵特征或必要特征,也不旨在用于限制所要求的保護(hù)的技術(shù)方案的范圍。
本公開的一些實(shí)施例提出了文本審核方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì),來(lái)解決以上背景技術(shù)部分提到的技術(shù)問(wèn)題中的一項(xiàng)或多項(xiàng)。
第一方面,本公開的一些實(shí)施例提供了一種文本審核方法,該方法包括:根據(jù)目標(biāo)圖像中文字的分布,生成上述目標(biāo)圖像對(duì)應(yīng)的熱力圖,其中,上述目標(biāo)圖像為包含有目標(biāo)物品對(duì)應(yīng)的展示信息的圖像;根據(jù)上述熱力圖,對(duì)上述目標(biāo)圖像進(jìn)行圖像分割,以生成區(qū)域圖像集合,其中,上述區(qū)域圖像集合中的區(qū)域圖像為含有文本的圖像;對(duì)上述區(qū)域圖像集合中的每個(gè)區(qū)域圖像進(jìn)行文本方向檢測(cè),以生成上述區(qū)域圖像對(duì)應(yīng)的文本方向信息,得到文本方向信息集合;根據(jù)上述熱力圖和上述區(qū)域圖像集合中每個(gè)區(qū)域圖像對(duì)應(yīng)的文本方向信息,對(duì)上述區(qū)域圖像進(jìn)行細(xì)化分割,以生成子圖像,得到子圖像集合;對(duì)上述子圖像集合中的每個(gè)子圖像進(jìn)行文本識(shí)別,以生成文本信息,得到文本信息集合;對(duì)上述文本信息集合中的每個(gè)文本信息進(jìn)行敏感詞匹配,以生成文本審核結(jié)果,得到文本審核結(jié)果集合。
第二方面,本公開的一些實(shí)施例提供了一種文本審核裝置,裝置包括:生成單元,被配置成根據(jù)目標(biāo)圖像中文字的分布,生成上述目標(biāo)圖像對(duì)應(yīng)的熱力圖,其中,上述目標(biāo)圖像為包含有目標(biāo)物品對(duì)應(yīng)的展示信息的圖像;圖像分割單元,被配置成根據(jù)上述熱力圖,對(duì)上述目標(biāo)圖像進(jìn)行圖像分割,以生成區(qū)域圖像集合,其中,上述區(qū)域圖像集合中的區(qū)域圖像為含有文本的圖像;文字方向檢測(cè)單元,被配置成對(duì)上述區(qū)域圖像集合中的每個(gè)區(qū)域圖像進(jìn)行文本方向檢測(cè),以生成上述區(qū)域圖像對(duì)應(yīng)的文本方向信息,得到文本方向信息集合;細(xì)化分割單元,被配置成根據(jù)上述熱力圖和上述區(qū)域圖像集合中每個(gè)區(qū)域圖像對(duì)應(yīng)的文本方向信息,對(duì)上述區(qū)域圖像進(jìn)行細(xì)化分割,以生成子圖像,得到子圖像集合;文本識(shí)別單元,被配置成對(duì)上述子圖像集合中的每個(gè)子圖像進(jìn)行文本識(shí)別,以生成文本信息,得到文本信息集合;敏感詞匹配單元,被配置成對(duì)上述文本信息集合中的每個(gè)文本信息進(jìn)行敏感詞匹配,以生成文本審核結(jié)果,得到文本審核結(jié)果集合。
第三方面,本公開的一些實(shí)施例提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,其上存儲(chǔ)有一個(gè)或多個(gè)程序,當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)上述第一方面任一實(shí)現(xiàn)方式所描述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京每日優(yōu)鮮電子商務(wù)有限公司,未經(jīng)北京每日優(yōu)鮮電子商務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110964902.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





