[實用新型]一種多場景命令詞語音識別裝置有效
| 申請?zhí)枺?/td> | 201720552541.4 | 申請日: | 2017-05-17 |
| 公開(公告)號: | CN207074554U | 公開(公告)日: | 2018-03-06 |
| 發(fā)明(設計)人: | 詹翀;楊若沖 | 申請(專利權)人: | 詹翀;楊若沖 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/28 |
| 代理公司: | 武漢臻誠專利代理事務所(普通合伙)42233 | 代理人: | 仲暉 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 場景 命令 詞語 識別 裝置 | ||
技術領域
本實用新型屬于語音識別領域,更具體地,涉及一種多場景命令詞識別裝置。
背景技術
近年來,隨著語音識別技術的進步,語音交互因其天然的便利性,在日常生活中應用越來越廣泛。語音喚醒和命令詞識別這兩個最常用的技術點在車載系統(tǒng)、智能家居等領域里已經(jīng)得到廣泛的應用。但我們也發(fā)現(xiàn),在目前大部分的應用方案中,語音交互采用的是在線識別的方式,這就要求設備在使用時需要連接互聯(lián)網(wǎng),將計算好的語音特征值上傳到服務器,服務器再返回識別后的結果。這種方式的好處是識別在云端進行,識別的結果會很精確,但這種方式的用戶體驗與網(wǎng)絡環(huán)境密切相關,在沒有網(wǎng)絡的時候就無法使用;而且因為要傳回數(shù)據(jù)到服務器,這就牽涉到用戶隱私和網(wǎng)絡安全等因素,所以大大的影響了應用范圍。
在這種情況下,業(yè)界開始采用離線的語音交互方式,相對于在云端服務器的識別方法,離線語音識別精簡了語言和聲學模型,所有的運算都在本地進行。離線語音交互種核心部件是命令詞的語音識別,但是受制于硬件條件限制,如計算能力、RAM和Flash大小以及功耗散熱等因素,尤其是主頻和RAM大小,這兩項直接限制了模型的大小以及所支持的命令詞數(shù)量,模型精簡過度之后會嚴重影響識別的準確率。此外,這種離線識別方案中,不同的應用場景使用的是不同的命令詞,需要提前將模型和代碼寫入硬件,這意味著不同的應用場景必須得開發(fā)不同的固件模塊,這在實際生產(chǎn)、使用中造成了極大的不便。
實用新型內容
針對現(xiàn)有技術的以上缺陷或改進需求,本實用新型提供了一種多場景命令詞語音識別裝置,其目的在于通過集成所有場景下語音識別模型,并在相應場景下進行調用,由此解決現(xiàn)有技術對于不同場景下的語音命令識別需要精簡模型導致識別率不高、或者針對不同場景設計不同固件造成成本過高的技術問題。
為實現(xiàn)上述目的,按照本實用新型的一個方面,提供了一種多場景命令詞語音識別裝置,包括場景標識器、外掛存儲器、內置存儲器、以及處理器;
所述處理器與場景標識器、外掛存儲器、以及內置存儲器電相連;
所述場景標識器,用于標識當前應用場景;
所述外掛存儲器,用于按照不同的應用場景,存儲應用場景相應的命令詞及其識別模型;
所述內置存儲器,用于存儲當前應用場景相應的命令詞極其識別模型;
所述處理器,用于根據(jù)場景標識器標識的當前應用場景,調用所述外掛存儲器種存儲的當前應用場景相應的命令詞極其識別模型進入所述內置存儲器,進行命令詞識別處理。
優(yōu)選地,所述多場景命令詞語音識別裝置,其所述場景標識器為數(shù)字電路。
優(yōu)選地,所述多場景命令詞語音識別裝置,其場景標識器為撥線器。
優(yōu)選地,所述多場景命令詞語音識別裝置,其外掛存儲器為RAM存儲器或FLASH存儲器。
優(yōu)選地,所述多場景命令詞語音識別裝置,其內置存儲器為RAN存儲器。
優(yōu)選地,所述多場景命令詞語音識別裝置,其識別模型為隱馬爾科夫模型。
優(yōu)選地,所述多場景命令詞語音識別裝置,其裝置還包括語音輸入模塊、以及輸出模塊;所述語音輸入模塊、以及輸出模塊與處理器電相連。
優(yōu)選地,所述多場景命令詞語音識別裝置,其語音輸入模塊,用于采集交互裝置外部語音信號并進行及降噪處理。
優(yōu)選地,所述多場景命令詞語音識別裝置,其輸出模塊,用于按照處理器識別出的命令,調用相應接口,實現(xiàn)命令功能。
優(yōu)選地,所述多場景命令詞語音識別裝置,其應用場景包括不同類型的應用場景和/或同一類型不同級別的應用場景。
總體而言,通過本實用新型所構思的以上技術方案與現(xiàn)有技術相比,能夠取得下列有益效果:
本實用新型利用內置存儲器調用外掛存儲器中的命令詞識別模型,可以大大的節(jié)省內存,在同等硬件條件下,支持更多的命令詞;對于同一套元器件可以適用于不同的應用場景,并且不必針對不同的場景中的內置存儲器中寫入不同的代碼,只需要在實施的時候調用不同的外掛存儲器即可,大大的節(jié)省了應用成本,提高經(jīng)濟效益。
附圖說明
圖1是本實用新型提供的多場景命令詞語音識別裝置結構示意圖;
圖2是本實用新型實施例提供的多場景命令詞語音識別裝置結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于詹翀;楊若沖,未經(jīng)詹翀;楊若沖許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201720552541.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





