[發(fā)明專利]基于語音識別的信息檢索方法、系統(tǒng)及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011044798.1 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN114282090A | 公開(公告)日: | 2022-04-05 |
| 發(fā)明(設(shè)計)人: | 羅曉燕 | 申請(專利權(quán))人: | 中興通訊股份有限公司 |
| 主分類號: | G06F16/9532 | 分類號: | G06F16/9532;G06F16/532;G06F16/583;G06F16/438;G10L15/26 |
| 代理公司: | 北京德崇智捷知識產(chǎn)權(quán)代理有限公司 11467 | 代理人: | 王斌 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語音 識別 信息 檢索 方法 系統(tǒng) 存儲 介質(zhì) | ||
本發(fā)明實施例公開了一種基于語音識別的信息檢索方法、系統(tǒng)及介質(zhì)。該基于語音識別的信息檢索方法,包括:采集語音信息;從所述語音信息中識別出目標(biāo)文本信息;基于所述目標(biāo)文本信息獲取目標(biāo)圖像;根據(jù)所述目標(biāo)圖像在預(yù)設(shè)的圖像數(shù)據(jù)庫中進(jìn)行檢索;在檢索到與所述目標(biāo)圖像對應(yīng)的描述信息后,至少示出所述描述信息,可以簡化用戶操作的同時,提高檢索的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明實施例涉及圖像識別技術(shù)領(lǐng)域,尤其涉及一種基于語音識別的信息檢索方法、系統(tǒng)及介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們獲取信息的途徑變得多樣性。當(dāng)我們碰到感興趣的事物時,最便捷的方式是利用手機(jī)或者電腦上網(wǎng)進(jìn)行搜索,查找有關(guān)該事物的相關(guān)信息。目前常用的搜索方式也不只局限于文本關(guān)鍵詞搜索,還出現(xiàn)了語音搜索或者圖片搜索,這些搜索功能需要在搜索框內(nèi)輸入文本或者圖片,或者在激活搜索框后對著電子裝置輸入語音。比如看到一款新車后通過網(wǎng)上輸入新車的照片來查看該新車的相關(guān)信息,滿足了人們多樣化的需求。
但是,在采用上述提到的文本檢索、語音識別或者圖片檢索的方式進(jìn)行相關(guān)信息的搜索時,會出現(xiàn)一些問題:比如用戶操作不方便、檢索結(jié)果不準(zhǔn)確。比如用戶在觀看視頻內(nèi)容時如果視頻中出現(xiàn)一個新款汽車,但是視頻播放速度太快,這是我們可能需要將視頻播放暫停,然后用手機(jī)對視頻中的汽車進(jìn)行拍照后再將汽車照片輸入到網(wǎng)上的搜索框中,從而獲取該新車的相關(guān)信息。因此,如何簡化用戶操作的同時,提高檢索的準(zhǔn)確性成為亟待解決的問題。
發(fā)明內(nèi)容
本說明書一個或多個實施例的目的是提供一種基于語音識別的信息檢索方法、系統(tǒng)及存儲介質(zhì),可以簡化用戶操作的同時,提高檢索的準(zhǔn)確性。
為解決上述技術(shù)問題,本說明書一個或多個實施例是這樣實現(xiàn)的:
第一方面,提供了一種基于語音識別的信息檢索方法,包括:采集用戶發(fā)出的用戶語音;從所述用戶語音識別出目標(biāo)文本信息;基于所述目標(biāo)文本信息獲取目標(biāo)圖像;在預(yù)設(shè)的圖像數(shù)據(jù)庫中檢索與所述目標(biāo)圖像對應(yīng)的描述信息;在檢索到所述描述信息后,至少將所述描述信息反饋給所述用戶。
第二方面,提出了一種基于語音識別的信息檢索系統(tǒng),包括:語音采集模塊,用于采集語音信息;文本識別模塊,用于從所述語音信息中識別出目標(biāo)文本信息;圖像獲取模塊,用于基于所述目標(biāo)文本信息獲取目標(biāo)圖像;檢索模塊,用于根據(jù)所述目標(biāo)圖像在預(yù)設(shè)的圖像數(shù)據(jù)庫中進(jìn)行檢索;反饋模塊,用于在檢索到與所述目標(biāo)圖像對應(yīng)的描述信息后,至少示出所述描述信息。
第三方面,提出了一種存儲介質(zhì),用于計算機(jī)可讀存儲,所述存儲介質(zhì)存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執(zhí)行時,實現(xiàn)如上文所述的基于語音識別的信息檢索方法的步驟。
由以上本說明書一個或多個實施例提供的技術(shù)方案可見,本發(fā)明實施例提供的基于語音識別的信息檢索方法,將語音識別和圖像檢索進(jìn)行結(jié)合,提高了信息檢索的準(zhǔn)確性。該信息檢索方法適用于在用戶講出涉及感興趣的事物時采集用戶發(fā)出的語音后從用戶語音進(jìn)行語音識別出有關(guān)感興趣事物的目標(biāo)文本信息,進(jìn)而基于目標(biāo)文本信息獲取有關(guān)感興趣事物的目標(biāo)圖像,接著將目標(biāo)圖像在預(yù)設(shè)的圖像數(shù)據(jù)庫中檢索與之對應(yīng)的描述信息,這里的檢索可以是基于目標(biāo)圖像和圖像數(shù)據(jù)庫中的標(biāo)準(zhǔn)圖像之間的圖像比對后確定出對應(yīng)的描述信息。在檢索到描述信息后至少將描述信息反饋給用戶,反饋的形式可以多種包括播放語音、顯示屏顯示等方式。可以看出,采用本發(fā)明實施例提供的基于語音識別的信息檢索方法可以在收到用戶一個語音后可以將對應(yīng)用戶感興趣的事物的描述信息反饋給用戶,由于結(jié)合了語音識別和圖像檢索技術(shù),提高了信息檢索的準(zhǔn)確性,同時極大地簡化了用戶的檢索操作,提高了用戶的使用電子設(shè)備的體驗。
附圖說明
為了更清楚地說明本說明書一個或多個實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對一個或多個實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本說明書中記載的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中興通訊股份有限公司,未經(jīng)中興通訊股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011044798.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:飲品機(jī)
- 下一篇:晶圓樣品分析方法和裝置
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





