有效
| 申請?zhí)枺?/td> | 201810246573.0 | 申請日: | 2018-03-23 |
| 公開(公告)號: | CN108563702B | 公開(公告)日: | 2022-02-25 |
| 發(fā)明(設(shè)計)人: | 盧振業(yè) | 申請(專利權(quán))人: | 美景聽聽(北京)科技有限公司 |
| 主分類號: | G06F16/58 | 分類號: | G06F16/58;G06F16/583;G06F16/587;G06F16/55;G06V20/10;G06Q50/14;G09F25/00 |
| 代理公司: | 北京知果之信知識產(chǎn)權(quán)代理有限公司 11541 | 代理人: | 唐海力;韓來兵 |
| 地址: | 100000 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 展品 圖像 識別 語音 講解 數(shù)據(jù)處理 方法 裝置 | ||
1.一種基于展品圖像識別的語音講解數(shù)據(jù)處理方法,其特征在于,包括:
獲取景點區(qū)域的展品圖像;
對所述展品圖像進行分類,得到與所述展品圖像對應(yīng)的類別;
根據(jù)所述類別對應(yīng)的特征模型提取圖像特征;
查詢景點圖像數(shù)據(jù)庫,獲取與所述圖像特征對應(yīng)的展品對象,得到展品對象列表,所述景點圖像數(shù)據(jù)庫存儲有展品對象和圖像特征、描述信息的關(guān)聯(lián)關(guān)系,包括:
在查詢景點圖像數(shù)據(jù)庫前,根據(jù)所述景點數(shù)據(jù)庫中的展品對象及其館藏地點確定目標(biāo)展品對象;
獲取所述目標(biāo)展品對象的展品圖像;
將所述目標(biāo)展品對象的展品圖像與所述景點數(shù)據(jù)庫中展品對象的所有展品圖像進行匹配,判斷是否一致;
如果不一致,則將所述目標(biāo)展品對象的展品圖像存儲至所述景點數(shù)據(jù)庫,作為同一展品對象的不同圖像收錄,完善并不斷優(yōu)化所述景點數(shù)據(jù)庫;
根據(jù)所述展品對象列表獲取用戶選擇的展品對象;
調(diào)取所述用戶選擇的展品對象對應(yīng)的描述信息并進行語音播放。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述展品圖像進行分類,包括:
獲取所述展品圖像中展品區(qū)域;
判斷所述展品區(qū)域是否為矩形;
如果為矩形,則確定所述展品圖像為第一類別,否則為第二類別,其中,所述第一類別為具有相框的展品,所述第二類別為不具有相框的展品。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法包括:
在對所述展品圖像進行分類前,判斷所述展品圖像是否為通過掃描方式得到;
如果所述展品圖像是通過掃描方式得到,則判斷所述展品圖像中展品是否落入圖像采集區(qū)域的預(yù)設(shè)框內(nèi);
如果所述展品圖像未落入所述預(yù)設(shè)框內(nèi),則重新掃描。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法還包括:
如果所述展品圖像是通過非掃描方式得到,則按照預(yù)設(shè)類別將所述展品圖像進行分類。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
在獲取景點區(qū)域展品圖像前,確定所述景點區(qū)域的位置。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法還包括:
確定用戶的當(dāng)前位置,包括:
利用GPS定位技術(shù)獲取用戶的當(dāng)前位置;和/或
獲取用戶根據(jù)預(yù)設(shè)區(qū)域選擇的當(dāng)前景點所處的位置。
7.一種基于展品圖像識別的語音講解數(shù)據(jù)處理的裝置,其特征在于,包括:
圖像獲取單元,用于獲取景點區(qū)域展品圖像;
圖像分類單元,用于對所述展品圖像進行分類,得到所述展品圖像對應(yīng)的類別;
特征提取單元,用于根據(jù)所述類別對應(yīng)的特征模型提取圖像特征;
結(jié)果篩選單元,用于查詢景點圖像數(shù)據(jù)庫,獲取與所述圖像特征對應(yīng)的展品對象,得到展品對象列表,所述景點圖像數(shù)據(jù)庫存儲有展品對象和圖像特征、描述信息的關(guān)聯(lián)關(guān)系,包括:
在查詢景點圖像數(shù)據(jù)庫前,根據(jù)所述景點數(shù)據(jù)庫中的展品對象及其館藏地點確定目標(biāo)展品對象;
獲取所述目標(biāo)展品對象的展品圖像;
將所述目標(biāo)展品對象的展品圖像與所述景點數(shù)據(jù)庫中展品對象的所有展品圖像進行匹配,判斷是否一致;
如果不一致,則將所述目標(biāo)展品對象的展品圖像存儲至所述景點數(shù)據(jù)庫,作為同一展品對象的不同圖像收錄,完善并不斷優(yōu)化所述景點數(shù)據(jù)庫;
對象選擇單元,用于根據(jù)所述展品對象列表獲取用戶選擇的展品對象;
語音播報單元,用于調(diào)取所述用戶選擇的展品對象對應(yīng)的描述信息并進行語音播放。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述圖像分類單元包括:
區(qū)域獲取模塊,用于獲取所述展品圖像中展品區(qū)域;
矩形判斷模塊,用于判斷所述展品區(qū)域是否為矩形;
類別劃分模塊,用于如果為矩形,則確定所述展品圖像為第一類別,否則為第二類別,其中,所述第一類別為具有相框的展品,所述第二類別為不具有相框的展品。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括:
掃描判斷單元,用于在對所述展品圖像進行分類前,判斷所述展品圖像是否為通過掃描方式得到;
第一處理單元,用于如果所述展品圖像是通過掃描方式得到,則判斷所述展品圖像中展品是否落入圖像采集區(qū)域的預(yù)設(shè)框內(nèi);
再掃描處理單元,用于如果所述展品圖像未落入所述預(yù)設(shè)框內(nèi),則重新掃描。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于美景聽聽(北京)科技有限公司,未經(jīng)美景聽聽(北京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810246573.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





