[發(fā)明專利]語音操控系統(tǒng)在審

申請?zhí)枺?/td>	201510835844.2	申請日：	2015-11-26
公開（公告）號：	CN105513594A	公開（公告）日：	2016-04-20
發(fā)明（設(shè)計）人：	不公告發(fā)明人	申請（專利權(quán)）人：	許傳平
主分類號：	G10L15/22	分類號：	G10L15/22;G06F3/0487
代理公司：	暫無信息	代理人：	暫無信息
地址：	266000 山東省青島***	國省代碼：	山東;37
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	語音操控系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及語音識別技術(shù)、圖像識別技術(shù)、文本識別技術(shù)、動作模擬技術(shù)和藍牙技術(shù)。

背景技術(shù)

開車時用手操控車載娛樂系統(tǒng)危險性非常大。

當前智能家居、智能穿戴、智能玩具對于語音操控的需求越來越強烈。

在醫(yī)療等領(lǐng)域很多人士手不方便操作終端，需要操控一些智能設(shè)備極其不便利。

如何通過語音有效的操控各種智能設(shè)備是目前急需解決的問題。

發(fā)明內(nèi)容

本發(fā)明的目的在于解決上述問題，提供了一種語音操控系統(tǒng)，提升了車載終端、手機、智能家居、移動互聯(lián)等各類應(yīng)用操作的便利性，讓操控交互更簡單，更人性化。

語音操控系統(tǒng)技術(shù)方案如下描述。

系統(tǒng)自定義命令和系統(tǒng)截取屏幕并識別圖片中可操作區(qū)域，可操作區(qū) 域包括圖標、按鈕、文本標簽等界面控件，然后生成對應(yīng)的命令集庫。

系統(tǒng)采集語音，通過在線或離線的方式對語音進行識別為文字。

系統(tǒng)匹配文字與命令集庫，識別語音控制命令。

系統(tǒng)模擬控制命令對應(yīng)的操控動作或通知應(yīng)用進行操作，實現(xiàn)語音操控目標。

根據(jù)本發(fā)明的語音操控系統(tǒng)的一實施例，語音識別和命令識別由系統(tǒng) 的語音命令識別層實現(xiàn)。

根據(jù)本發(fā)明的語音操控系統(tǒng)的一實施例，應(yīng)用的操作由系統(tǒng)的操作執(zhí) 行層完成。

根據(jù)本發(fā)明的語音操控系統(tǒng)的一實施例，語音操控系統(tǒng)狀態(tài)包括初期空閑、開始提示、采集語音、語音識別、命令匹配結(jié)果提示、操作執(zhí)行。

用戶端遙控器包括藍牙遙控器，用于接收用戶按鍵事件傳輸至智能終端。

智能終端包括圖形和文本識別模塊、語音識別命令模塊和操作執(zhí)行模塊，各模塊功能如下。

圖形和文本識別模塊，把自定義的命令和截圖識別的可操作區(qū)域命令匯合生成命令集庫。

語音識別命令模塊，就采樣的語音識別為文字，然后和命令集庫匹配識別語音控制命令。

操作執(zhí)行模塊，模擬控制命令對應(yīng)的操控動作或通知應(yīng)用進行操作，實現(xiàn)語音操控目標。

本發(fā)明對比現(xiàn)有技術(shù)有如下的有益效果：本發(fā)明的方案是對現(xiàn)有應(yīng)有界面識別其可操作區(qū)域動態(tài)生成命令集庫，在語音識別之后進行語音命令的識別，然后模擬相應(yīng)的操作動作或通知應(yīng)用執(zhí)行。相較于傳統(tǒng)技術(shù)，本發(fā)明可以執(zhí)行應(yīng)用的任何命令，而傳統(tǒng)的技術(shù)只能支持幾個常用的命令，每次添加命令都需要底層深度定制；本發(fā)明可以推廣到接受語音操控的各種智能終端，包括但不限于智能手機、智能車載、智能穿戴、智能家居、智能醫(yī)療、智能玩具等可以接受語音輸入的用戶終端。

附圖說明

圖1示出了本發(fā)明的語音操控系統(tǒng)的較佳實施例的流程圖。

圖2示出了本發(fā)明的語音操控系統(tǒng)的較佳實施例的業(yè)務(wù)邏輯圖。具體實施方式

下面結(jié)合附圖和實施例對本發(fā)明作進一步的描述。

圖1示出了本發(fā)明的語音操控系統(tǒng)的較佳實施例的流程。請參見圖1，本實施例的語音操控系統(tǒng)的實施步驟詳述如下。

步驟100系統(tǒng)自定義命令和系統(tǒng)截取屏幕并識別圖片中可操作區(qū) 域，可操作區(qū)域包括圖標、按鈕、文本標簽等界面控件，然后生成對應(yīng)的命令集庫。

步驟102系統(tǒng)采集語音，通過在線或離線的方式對語音進行識別為文字。

步驟104系統(tǒng)匹配文字與命令集庫，識別語音控制命令。

圖2示出了本發(fā)明的語音操控系統(tǒng)的較佳實施例的業(yè)務(wù)邏輯圖，請參見圖2，本實施例的語音操控系統(tǒng)包括用戶端遙控器20和智能終端60。

用戶端遙控器20包括藍牙遙控器，用于接收用戶按鍵事件傳輸至智能終端。智能終端60包括圖形和文本識別模塊602、語音命令識別模塊604 和操作執(zhí)行模塊606。語音命令識別模塊604對采樣的語音進行識別后轉(zhuǎn) 化成文字并對轉(zhuǎn)化后的文字進行命令識別。操作執(zhí)行模塊606模擬控制命令對應(yīng)的操控動作或通知應(yīng)用進行操作，實現(xiàn)語音操控目標。

例如，用戶打開車載導航，用戶點擊藍牙遙控器語音開始鍵，說出“搜地點”命令。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于許傳平，未經(jīng)許傳平許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201510835844.2/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準模板；訓練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】