[發(fā)明專利]基于人機(jī)交互的圖像識別方法及裝置在審
| 申請?zhí)枺?/td> | 201210537239.3 | 申請日: | 2012-12-13 |
| 公開(公告)號: | CN103065120A | 公開(公告)日: | 2013-04-24 |
| 發(fā)明(設(shè)計)人: | 何松 | 申請(專利權(quán))人: | 何松 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06F3/0481 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100096 北京市回*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 人機(jī)交互 圖像 識別 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體涉及一種基于人機(jī)交互的圖像識別方法及裝置。
背景技術(shù)
圖像識別,是利用計算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。
圖像識別最基本的方法是基于圖像邊緣的識別,圖像邊緣的識別有拉帕拉斯算子,貝塞爾算子,平均值等方法。把邊緣識別出來之后通過和數(shù)據(jù)庫(圖形或者文字等)進(jìn)行對比掃描,就可以把圖像識別出來了。
圖像識別向來是計算機(jī)領(lǐng)域的難點(diǎn),很難做到召回率和準(zhǔn)確率兼顧。本發(fā)明通過簡單的與用戶交互很好的解決這個問題,基本保證100%的召回率和準(zhǔn)確率。
發(fā)明內(nèi)容
本發(fā)明提出一種基于人機(jī)交互的圖像識別方法及裝置,可提高召回率和準(zhǔn)確率。
一種基于人機(jī)交互的圖像識別方法,包括:利用圖像識別算法確定圖像的邊界信息;根據(jù)所述圖像的邊界信息,判斷是否能區(qū)分圖像中的主體區(qū)域;如果能區(qū)分圖像中的主體區(qū)域,自動劃分出主體區(qū)域并輸出給用戶確認(rèn);如果不能區(qū)分圖像中的主體區(qū)域,提示用戶進(jìn)行主體區(qū)域的邊界描繪。
優(yōu)選地,該方法還包括:如果圖像中包括可被識別的二維碼或/和統(tǒng)一資源定位符,則調(diào)取所述二維碼或/和統(tǒng)一資源定位符對應(yīng)的信息。
其中,所述圖像識別算法包括拉帕拉斯算法,貝塞爾算法,和/或,平均值算法。
其中,所述用戶通過鼠標(biāo)或觸屏在圖像中進(jìn)行邊界描繪。
一種基于人機(jī)交互的圖像識別裝置,包括:確定單元,用于利用圖像識別算法確定圖像的邊界信息;判斷單元,用于根據(jù)所述圖像的邊界信息,判斷是否能區(qū)分圖像中的主體區(qū)域;自動劃分單元,用于在判斷單元能區(qū)分圖像中的主體區(qū)域時,自動劃分出主體區(qū)域并輸出給用戶確認(rèn);用戶描繪指示單元,用于在判斷單元補(bǔ)能區(qū)分圖像中的主體區(qū)域時,提示用戶進(jìn)行主體區(qū)域的邊界描繪。
優(yōu)選地,該裝置還包括:特殊處理單元,用于調(diào)取圖像中包括的可被識別的二維碼或/和統(tǒng)一資源定位符對應(yīng)的信息。
另外,本發(fā)明還提供一種自動推薦相似商品的方法,包括:獲取特定感興趣商品的圖像;抽取出所述圖像中的物品區(qū)域信息;根據(jù)所述物品區(qū)域信息,在商品庫中進(jìn)行搜索,確定向用戶推薦的相似商品;其中,所述抽取出所述圖像中的物品區(qū)域信息的具體步驟包括:利用圖像識別算法確定圖像的邊界信息;根據(jù)所述圖像的邊界信息,判斷是否能區(qū)分圖像中的物品區(qū)域;如果能區(qū)分圖像中的物品區(qū)域,自動劃分出物品區(qū)域信息并輸出給用戶確認(rèn);如果不能區(qū)分圖像中的物品區(qū)域,提示用戶進(jìn)行物品區(qū)域信息的邊界描繪。
上述自動推薦相似商品的方法還包括:如果圖像中包括可被識別的二維碼或/和統(tǒng)一資源定位符,則調(diào)取所述二維碼或/和統(tǒng)一資源定位符對應(yīng)的信息。
其中,所述圖像識別算法包括拉帕拉斯算法,貝塞爾算法,和/或,平均值算法。
其中,所述用戶通過鼠標(biāo)或觸屏在圖像中進(jìn)行邊界描繪通過本發(fā)明提供的方法和裝置,
通過本發(fā)明提供的方法和裝置,通過將主體區(qū)域信息輸出給用戶進(jìn)行確認(rèn)或請用戶進(jìn)行邊界描繪,借助人機(jī)交互改善圖像識別的召回率和準(zhǔn)確率。
上述圖像識別方案可有各種應(yīng)用,例如,應(yīng)用到自動推薦相似商品的方案中。用戶可以在手機(jī)上通過拍照等方式,極其便利的完成信息獲取,并作為精確輸入傳遞給其他第三方系統(tǒng)使用。這是以前所有其他圖像處理類系統(tǒng)無法做到的。
附圖說明
圖1是本發(fā)明基于人機(jī)交互的圖像識別方法的流程圖;
圖2是本發(fā)明基于人機(jī)交互的圖像識別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
很多情況下,用戶希望從一副圖像中提取出真正關(guān)心的部分。目前主流的圖像識別方法大都不能完美解決這個問題。本發(fā)明通過簡單的與用戶交互,基本100%解決這個問題。
參見圖1,為本發(fā)明提供的基于人機(jī)交互的圖像識別方法的流程圖,包括以下步驟:
S101:利用圖像識別算法確定圖像的邊界信息;
S102:根據(jù)所述圖像的邊界信息,判斷是否能區(qū)分圖像中的主體區(qū)域;
S103:如果能區(qū)分圖像中的主體區(qū)域,自動劃分出主體區(qū)域并輸出給用戶確認(rèn);
S104:如果不能區(qū)分圖像中的主體區(qū)域,提示用戶進(jìn)行主體區(qū)域的邊界描繪。
進(jìn)一步,如果圖像中包括可被識別的二維碼或/和統(tǒng)一資源定位符,則調(diào)取二維碼或/和統(tǒng)一資源定位符對應(yīng)的信息。
其中,圖像識別算法包括但不限于現(xiàn)有和未來將出現(xiàn)的圖像識別算法,例如:拉帕拉斯算法、貝塞爾算法、平均值算法等。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于何松,未經(jīng)何松許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210537239.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:實(shí)現(xiàn)心跳機(jī)制的方法、應(yīng)用服務(wù)器、網(wǎng)絡(luò)數(shù)據(jù)庫及系統(tǒng)
- 下一篇:一種消息處理的方法及移動設(shè)備
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于Web服務(wù)的分布式人機(jī)交互系統(tǒng)
- 用于提供人機(jī)交互資源的方法及設(shè)備
- 基于配置化實(shí)現(xiàn)人機(jī)交互功能的方法
- 一種人機(jī)交互平臺位置可調(diào)節(jié)的儲物柜
- 車載人機(jī)交互方法、系統(tǒng)及計算機(jī)可讀存儲介質(zhì)
- 一種網(wǎng)格化的飛行管理系統(tǒng)人機(jī)交互設(shè)計與實(shí)現(xiàn)方法
- 人機(jī)交互優(yōu)化方法以及相關(guān)裝置
- 消毒型自助設(shè)備及其控制方法
- 一種實(shí)時3D遠(yuǎn)程人機(jī)交互裝置
- 一種人機(jī)交互設(shè)備控制方法及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





