[發(fā)明專(zhuān)利]一種圖像識(shí)別的方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202111488891.6 | 申請(qǐng)日: | 2021-12-08 |
| 公開(kāi)(公告)號(hào): | CN113920512B | 公開(kāi)(公告)日: | 2022-03-15 |
| 發(fā)明(設(shè)計(jì))人: | 王偉偉;王騰飛 | 申請(qǐng)(專(zhuān)利權(quán))人: | 共道網(wǎng)絡(luò)科技有限公司 |
| 主分類(lèi)號(hào): | G06V30/148 | 分類(lèi)號(hào): | G06V30/148;G06V30/146;G06V30/42;G06V30/414;G06V30/19;G06V10/774;G06K9/62;G06N3/08 |
| 代理公司: | 北京博思佳知識(shí)產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 王劍 |
| 地址: | 311100 浙江省杭州市余杭*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖像 識(shí)別 方法 裝置 | ||
1.一種圖像識(shí)別的方法,應(yīng)用于計(jì)算機(jī)設(shè)備,其特征在于,所述方法包括:
接收用戶輸入的圖像,檢測(cè)出所述圖像中的有效區(qū)域,所述有效區(qū)域包括文本區(qū)域、圖像區(qū)域;
確定所述有效區(qū)域的信息類(lèi)型;所述信息類(lèi)型包括屬性、屬性值;
基于所述有效區(qū)域的位置信息和信息類(lèi)型,以語(yǔ)義邏輯關(guān)系為劃分依據(jù),將所述有效區(qū)域劃分為若干區(qū)域集合;
針對(duì)每個(gè)區(qū)域集合,基于該集合中各有效區(qū)域中的文本內(nèi)容或圖像,以及各有效區(qū)域的位置信息識(shí)別出所述圖像攜帶的信息,每個(gè)區(qū)域集合對(duì)應(yīng)識(shí)別出的信息包括屬性信息和與其對(duì)應(yīng)的屬性值信息;其中,當(dāng)所述屬性信息為需要錄入的屬性信息時(shí),與其對(duì)應(yīng)的屬性值信息被自動(dòng)獲取并錄入。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述有效區(qū)域的位置信息和信息類(lèi)型以語(yǔ)義邏輯關(guān)系為劃分依據(jù),將所述有效區(qū)域劃分為若干區(qū)域集合,包括:
基于所述有效區(qū)域的位置信息,對(duì)各個(gè)有效區(qū)域進(jìn)行編號(hào);
根據(jù)所述有效區(qū)域的信息類(lèi)型,按照編號(hào)順序判斷當(dāng)前有效區(qū)域與其一階鄰居有效區(qū)域是否具有語(yǔ)義邏輯關(guān)系;
在當(dāng)前有效區(qū)域與一階鄰居有效區(qū)域具有語(yǔ)義邏輯關(guān)系的情況下,將一階鄰居有效區(qū)域劃分至當(dāng)前有效區(qū)域所在的集合中,并將所述一階鄰居有效區(qū)域更新為新的當(dāng)前有效區(qū)域;
在當(dāng)前有效區(qū)域與一階鄰居有效區(qū)域不具有語(yǔ)義邏輯關(guān)系的情況下,確定當(dāng)前有效區(qū)域所在集合劃分完畢,并將所述一階鄰居有效區(qū)域更新為新的當(dāng)前有效區(qū)域。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述有效區(qū)域的位置信息,對(duì)各個(gè)有效區(qū)域進(jìn)行編號(hào),包括:
根據(jù)各個(gè)有效區(qū)域的位置信息,按照從左到右、從上至下的順序?qū)Ω鱾€(gè)有效區(qū)域依次進(jìn)行有序編號(hào)。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述有效區(qū)域中的文本區(qū)域的信息類(lèi)型包括屬性、屬性值;所述有效區(qū)域中的圖像區(qū)域的信息類(lèi)型是屬性值;所述判斷當(dāng)前有效區(qū)域與其一階鄰居有效區(qū)域是否具有語(yǔ)義邏輯關(guān)系,包括:
若當(dāng)前有效區(qū)域的信息類(lèi)型是屬性,且其一階鄰居有效區(qū)域的類(lèi)型是屬性值;確定當(dāng)前有效區(qū)域與其一階鄰居有效區(qū)域具有語(yǔ)義邏輯關(guān)系。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括:
確定所述有效區(qū)域所屬信息類(lèi)型的行位置;
所述判斷當(dāng)前有效區(qū)域與其一階鄰居有效區(qū)域是否具有語(yǔ)義邏輯關(guān)系,還包括:
若當(dāng)前有效區(qū)域的信息類(lèi)型是屬性,且行位置是頭行,當(dāng)其一階鄰居有效區(qū)域的信息類(lèi)型也是屬性,且行位置是非頭行時(shí),確定當(dāng)前有效區(qū)域與其一階鄰居有效區(qū)域具有語(yǔ)義邏輯關(guān)系;
若當(dāng)前有效區(qū)域的信息類(lèi)型是屬性,且行位置是非頭行,當(dāng)其一階鄰居有效區(qū)域的信息類(lèi)型也是屬性,且行位置是非頭行時(shí),確定當(dāng)前有效區(qū)域與其一階鄰居有效區(qū)域具有語(yǔ)義邏輯關(guān)系;
若當(dāng)前有效區(qū)域的信息類(lèi)型是屬性值,且行位置是頭行,當(dāng)其一階鄰居有效區(qū)域的信息類(lèi)型也是屬性值,且行位置是非頭行,確定當(dāng)前有效區(qū)域與其一階鄰居有效區(qū)域具有語(yǔ)義邏輯關(guān)系;
若當(dāng)前有效區(qū)域的信息類(lèi)型是屬性值,且行位置是非頭行,當(dāng)其一階鄰居有效區(qū)域的信息類(lèi)型也是屬性值,且行位置是非頭行,確定當(dāng)前有效區(qū)域與其一階鄰居有效區(qū)域具有語(yǔ)義邏輯關(guān)系。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于該集合中各有效區(qū)域中的文本內(nèi)容或圖像,以及各有效區(qū)域的位置信息識(shí)別出所述圖像攜帶的信息,包括:
基于行位置對(duì)相同信息類(lèi)型的有效區(qū)域進(jìn)行排序;
按照排序順序,基于信息類(lèi)型是屬性的文本區(qū)域的文本內(nèi)容識(shí)別出所述圖像攜帶的屬性;
按照排序順序,基于信息類(lèi)型是屬性值的文本區(qū)域的文本內(nèi)容以及圖像區(qū)域的圖像識(shí)別出所述圖像攜帶的所述屬性的屬性值。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于共道網(wǎng)絡(luò)科技有限公司,未經(jīng)共道網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111488891.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





