[發(fā)明專利]基于展品圖像識別的語音講解數(shù)據(jù)處理方法及裝置有效
| 申請?zhí)枺?/td> | 201810246573.0 | 申請日: | 2018-03-23 |
| 公開(公告)號: | CN108563702B | 公開(公告)日: | 2022-02-25 |
| 發(fā)明(設(shè)計)人: | 盧振業(yè) | 申請(專利權(quán))人: | 美景聽聽(北京)科技有限公司 |
| 主分類號: | G06F16/58 | 分類號: | G06F16/58;G06F16/583;G06F16/587;G06F16/55;G06V20/10;G06Q50/14;G09F25/00 |
| 代理公司: | 北京知果之信知識產(chǎn)權(quán)代理有限公司 11541 | 代理人: | 唐海力;韓來兵 |
| 地址: | 100000 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 展品 圖像 識別 語音 講解 數(shù)據(jù)處理 方法 裝置 | ||
本申請公開了一種基于展品圖像識別的語音講解數(shù)據(jù)處理方法及裝置,其中方法包括:獲取景點區(qū)域的展品圖像;對所述展品圖像進行分類,得到與所述展品圖像對應(yīng)的類別;根據(jù)所述類別對應(yīng)的特征模型提取圖像特征;查詢景點圖像數(shù)據(jù)庫,獲取與所述圖像特征對應(yīng)的展品對象,得到展品對象列表;根據(jù)所述展品對象列表獲取用戶選擇的展品對象;調(diào)取所述用戶選擇的展品對象對應(yīng)的描述信息并進行語音播放。本申請采用圖像識別的方式,通過所述景點圖像數(shù)據(jù)庫的智能學習,達到完善所述景點圖像數(shù)據(jù)庫的目的,以便提高對景點區(qū)域內(nèi)展品圖像進行識別的精確度,為語音講解起到輔助作用,最終解決了通過圖像識別實現(xiàn)智能語音導(dǎo)游的目的。
技術(shù)領(lǐng)域
本申請涉及圖像識別技術(shù)領(lǐng)域,具體而言,涉及一種基于展品圖像識別的語音講解數(shù)據(jù)處理方法及裝置。
背景技術(shù)
隨著旅游行業(yè)的發(fā)展,為了詳細了解各個景點,游客一般是通過專業(yè)的導(dǎo)游進行介紹來了解的。因?qū)I(yè)導(dǎo)游的費用較高,因此直接提高了游客旅游的費用。
為了解決這種問題,手機語音導(dǎo)游行業(yè)隨著產(chǎn)生。手機語音導(dǎo)游系統(tǒng)目前主要應(yīng)用在風景名勝區(qū),內(nèi)容包括景區(qū)內(nèi)各種游覽線路、沿途各景點的語音介紹,景區(qū)內(nèi)各種服務(wù)設(shè)施所處的位置及文字介紹。游客可以在進入景區(qū)開始,選擇感興趣的游覽線路,沿途可以隨時通過手機定位,通過地圖找到自己所處的景點位置,聆聽所處的景點介紹。
然而這種方式對室內(nèi)游覽并不適應(yīng),如博物館(尤其是國外博物館)等場所。因為是室內(nèi)定位對定位手機定位對室內(nèi)區(qū)域的定位的精確度有很高要求,因此在手機信號弱的區(qū)域、信號盲區(qū)或室內(nèi)(如室內(nèi)博物館)等區(qū)域并不能精確地確定當前位置,進而直接影響了游客對當前景點的了解。
發(fā)明內(nèi)容
本申請的主要目的在于提供一種基于展品圖像識別的語音講解數(shù)據(jù)處理方法,以解決針對室內(nèi)的景點區(qū)域內(nèi)展品進行識別,提高圖像識別效率及識別準確率,最終解決智能語音導(dǎo)游精確度低的技術(shù)問題。
為了實現(xiàn)上述目的,根據(jù)本申請的一個方面,提供了一種基于展品圖像識別的語音講解數(shù)據(jù)處理方法。
根據(jù)本申請的基于展品圖像識別的語音講解數(shù)據(jù)處理方法包括:
獲取景點區(qū)域的展品圖像;
對所述展品圖像進行分類,得到與所述展品圖像對應(yīng)的類別;
根據(jù)所述類別對應(yīng)的特征模型提取圖像特征;
查詢景點圖像數(shù)據(jù)庫,獲取與所述圖像特征對應(yīng)的展品對象,得到展品對象列表,所述景點圖像數(shù)據(jù)庫存儲有展品對象和圖像特征、描述信息的關(guān)聯(lián)關(guān)系;
根據(jù)所述展品對象列表獲取用戶選擇的展品對象;
調(diào)取所述用戶選擇的展品對象對應(yīng)的描述信息并進行語音播放。
進一步,所述對所述展品圖像進行分類,包括:
獲取所述展品圖像中展品區(qū)域;
判斷所述展品區(qū)域是否為矩形;
如果為矩形,則確定所述展品圖像為第一類別,否則為第二類別,其中,所述第一類別為具有相框的展品,所述第二類別為不具有相框的展品。
進一步,所述方法還包括:
在對所述展品圖像進行分類前,判斷所述展品圖像是否為通過掃描方式得到;
如果所述展品圖像是通過掃描方式得到,則判斷所述展品圖像中展品是否落入圖像采集區(qū)域的預(yù)設(shè)框內(nèi);
如果所述展品圖像未落入所述預(yù)設(shè)框內(nèi),則重新掃描。
進一步,所述方法還包括:
如果所述展品圖像是通過非掃描方式得到,則按照預(yù)設(shè)類別將所述展品圖像進行分類。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于美景聽聽(北京)科技有限公司,未經(jīng)美景聽聽(北京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810246573.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





