[發明專利]一種基于圖像文字識別的商品推送方法和裝置在審
| 申請號: | 201210279367.2 | 申請日: | 2012-08-07 |
| 公開(公告)號: | CN102831200A | 公開(公告)日: | 2012-12-19 |
| 發明(設計)人: | 韓鈞宇;丁二銳;吳中勤;文林福 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/00 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何青瓦;李慶波 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖像 文字 識別 商品 推送 方法 裝置 | ||
【技術領域】
本發明涉及計算機應用技術領域,特別涉及一種基于圖像文字識別的商品推送方法和裝置。
【背景技術】
隨著移動互聯網的迅速發展,基于移動終端攝像頭采集到的圖像的應用越來越廣泛。其中圖像文字識別技術將圖像中的文字進行識別,轉換為文本文字,從而減輕了用戶輸入對應文字信息的負擔,方便用戶存儲、編輯對應的文字信息。
在實際應用過程中存在如下情況,用戶看到某個商品后想查詢該商品的相關信息,例如商品用途、廠家、價格、哪里有售等等,現有的方式就是用戶通過搜索引擎手工輸入商品名稱等作為query,并從大量搜索結果中找尋想要的商品信息,顯然這種方式操作十分繁瑣,需要大量的手工操作。
【發明內容】
有鑒于此,本發明提供了一種基于圖像文字識別的商品推送方法和裝置,以便于減少用戶獲得商品信息的操作,實現更加方便。
具體技術方案如下:
一種基于圖像文字識別的商品推送方法,該方法包括:
S1、獲取待識別圖像中的文字區域;
S2、對所述文字區域進行文字識別;
S3、利用識別結果查詢商品庫獲得識別結果對應的商品信息;
S4、推送包含所述商品信息的商品查詢列表。
根據本發明一優選實施例,所述步驟S1具體包括:
服務器接收移動終端發送來的待識別圖像,從所述待識別圖像中提取文字區域;或者,
服務器接收移動終端從待識別圖像中提取并發送來的文字區域。
根據本發明一優選實施例,所述步驟S2具體包括:
對文字區域進行二值化;
對二值化后的文字區域分割為各字塊;
提取各字塊的特征信息并與特征數據庫進行匹配,將匹配結果作為各字塊的識別結果;
按順序將各字塊的識別結果進行組合得到所述文字區域的識別結果。
根據本發明一優選實施例,所述商品庫包括一個以上類別的商品庫;
在所述步驟S3中查詢所有商品庫;或者,
在所述步驟S1中還獲取用戶選擇的個性化選項內容,在所述步驟S3中查詢所述用戶選擇的個性化選項內容對應的商品庫。
根據本發明一優選實施例,所述查詢商品庫獲得識別結果對應的商品信息具體包括:
依據商品庫的商品信息中文字內容與識別結果之間的語義相似度,計算商品信息的文字匹配權重,將文字匹配權重排在前n1個的商品信息包含在商品查詢列表中,n1為預設的正整數;或者,
依據商品庫的商品信息中文字內容與識別結果之間的語義相似度,計算商品信息的文字匹配權重,以及依據所述待識別圖像與商品庫的商品信息中圖像之間的相似度計算商品信息的圖像匹配權重,結合文字匹配權重和圖像匹配權重計算商品信息對應的查詢權重,將查詢權重排在前n2個的商品信息包含在商品查詢列表中,n2為預設的正整數;或者,
依據商品庫的商品信息中文字內容與識別結果之間的語義相似度,計算商品信息的文字匹配權重,以及依據所述待識別圖像與商品庫的商品信息中圖像之間的相似度計算商品信息的圖像匹配權重,結合文字匹配權重和圖像匹配權重計算商品信息對應的查詢權重,基于商品信息的被查詢狀況計算商品信息的選擇權重,結合所述查詢權重和選擇權重計算商品信息的總權重,將總權重值排在前n3個的商品信息生成商品查詢列表,n3為預設的正整數。
根據本發明一優選實施例,所述計算商品信息的選擇權重包括:
根據商品信息被查詢到的總次數計算商品信息的選擇權重,總次數越大選擇權重值越大;或者,
利用商品信息被查詢到的總次數確定商品信息的商品權重,總次數越大商品權重值越大,再利用商品信息所屬類別的所有商品信息被當前用戶查看的總次數確定用戶個性化權重,利用商品信息的商品權重與用戶個性化權重的乘積確定該商品信息的選擇權重。
一種基于圖像文字識別的商品推送裝置,該裝置包括:
區域獲取單元,用于獲取待識別圖像中的文字區域;
文字識別單元,用于對所述文字區域進行文字識別;
商品查詢單元,用于所述文字識別單元的識別結果查詢商品庫獲得識別結果對應的商品信息;
結果推送單元,用于推送包含所述商品信息的商品查詢列表。
根據本發明一優選實施例,所述區域獲取單元接收移動終端發送來的待識別圖像,從所述待識別圖像中提取文字區域;或者,接收移動終端從待識別圖像中提取并發送來的文字區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210279367.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





