[發明專利]一種應用于自行車環境的語音控制方法及系統有效
| 申請號: | 201710522405.5 | 申請日: | 2017-06-30 |
| 公開(公告)號: | CN107403619B | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 李成華;葉正;金燦燦;劉麗君;李駿;劉雄風 | 申請(專利權)人: | 武漢泰迪智慧科技有限公司 |
| 主分類號: | G10L15/14 | 分類號: | G10L15/14;G10L15/16;G10L15/26;G06F40/30;G06N3/02 |
| 代理公司: | 武漢智嘉聯合知識產權代理事務所(普通合伙) 42231 | 代理人: | 黃君軍 |
| 地址: | 430000 湖北省武*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 自行車 環境 語音 控制 方法 系統 | ||
本發明公開了一種應用于自行車環境的語音控制方法及系統,其中方法包括:獲取語音消息,對語音消息進行預處理;對語音消息進行語音識別,從而將語音消息轉化為識別結果文本;對識別結果文本進行預處理;判斷識別結果文本的主題,然后判斷識別結果文本的意圖和抽取實體信息;根據識別結果文本的主題、意圖、實體信息查找數據庫,匹配并執行識別結果文本對應的動作。有益效果:利用人工神經網絡模型和隱馬爾可夫模型的混合模型進行語音識別,語音識別效果更好;通過先判斷出主題,再判斷出意圖是主題對應的意圖集合中的哪一個,能夠更加精準地挖掘出用戶意圖;不需要人工編寫特征,準確率較高、系統擴展性/維護性強、耗時較少。
技術領域
本發明涉及深度學習技術領域,尤其是涉及一種應用于自行車環境的語音控制方法及系統。
背景技術
目前工業界主要基于特征工程的方法完成語義信息的識別和提取,然而特征工程需要大量人工標注數據集以及大量規則的編寫,非常耗時耗力;還有部分技術基于深度學習來完成這一任務,雖然不用人工編寫特征,但是其需要大量的人工標注數據,仍然比較耗時,且準確率不夠高。
發明內容
本發明的目的在于克服上述技術不足,提出一種應用于自行車環境的語音控制方法及系統,解決現有技術中的上述技術問題。
為達到上述技術目的,本發明的技術方案提供一種應用于自行車環境的語音控制方法,包括:
S1、獲取語音消息,對語音消息進行預處理;
S2、對預處理后的語音消息進行語音識別,從而將預處理后的語音消息轉化為識別結果文本;
S3、對識別結果文本進行預處理;
S4、識別結果文本進行預處理操作后,判斷識別結果文本的主題,然后判斷識別結果文本的意圖和抽取識別結果文本的實體信息;
S5、根據識別結果文本的主題、意圖、實體信息查找數據庫,匹配出識別結果文本對應的動作;
S6、執行S5匹配到的動作。
本發明還提供一種應用于自行車環境的語音控制系統,包括:
語音消息預處理模塊:獲取語音消息,對語音消息進行預處理;
語音識別模塊:對預處理后的語音消息進行語音識別,從而將預處理后的語音消息轉化為識別結果文本;
文本預處理模塊:對識別結果文本進行預處理;
主題意圖判斷模塊:識別結果文本進行預處理操作后,判斷識別結果文本的主題,然后判斷識別結果文本的意圖和抽取識別結果文本的實體信息;
動作匹配模塊:根據識別結果文本的主題、意圖、實體信息查找數據庫,匹配出識別結果文本對應的動作;
動作執行模塊:執行動作匹配模塊匹配到的動作。
與現有技術相比,本發明的有益效果包括:利用人工神經網絡模型和隱馬爾可夫模型的混合模型進行語音識別,不僅能充分利用神經網絡強的分類能力和輸入輸出映射能力,同時保留了隱馬爾可夫模型較強的對時間序列結構的建模能力,使得語音識別效果更好;通過先判斷出識別結果文本的主題,再判斷出識別結果文本的意圖是主題對應的意圖集合中的哪一個,在用戶需求多樣化的情況下,能夠更加精準地挖掘出用戶意圖,更好地與用戶進行交互;本發明的方法不需要人工編寫特征,準確率較高、系統擴展性/維護性強、耗時較少。
附圖說明
圖1是本發明提供的一種應用于自行車環境的語音控制方法流程圖;
圖2是本發明提供的一種應用于自行車環境的語音控制系統結構框圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢泰迪智慧科技有限公司,未經武漢泰迪智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710522405.5/2.html,轉載請聲明來源鉆瓜專利網。





