[發明專利]一種具備語音控制功能智能手機在審
| 申請號: | 201710708957.5 | 申請日: | 2017-08-17 |
| 公開(公告)號: | CN107277276A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 陳超 | 申請(專利權)人: | 陳超 |
| 主分類號: | H04M1/725 | 分類號: | H04M1/725;G10L15/22;G10L15/26 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200083 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 具備 語音 控制 功能 智能手機 | ||
技術領域
本發明專利涉及一種具備語音控制功能的智能手機。
背景技術
最早出現的手機采用鍵盤撥號控制,主要功能是打電話,后來發展了短信等功能,都是通過鍵盤控制。隨著技術發展,智能手機軟件采用操作系統,可同時進行多個程序和任務,控制輸入方式以觸摸屏為主,保留少量快捷按鈕,信息輸出則以屏幕顯示為主,根據程序需求也有輸出語音信息通過揚聲器輸出信息。當前對手機操縱都必須用手操作,在某些場合使用者手脫不開,會影響手機使用,或一些肢體或眼睛殘疾者根本無法使用手及對手機屏幕觀察完成對現有智能手機操縱和使用。同時隨著語音識別技術和人工智能(AI)飛速發展,在一些手機的文字輸入應用程序中已有一些成熟的語音輸入應用,為該技術用于智能手機作為用口控制輸入手段提供一定技術基礎和可能。
聲音(sound)是由物體振動產生的聲波。是通過介質(空氣或固體、液體)傳播并能被人或動物聽覺器官所感知的波動現象。最初發出振動(震動)的物體叫聲源。聲音以波的形式振動(震動)傳播。聲音是聲波通過任何物質傳播形成的運動。聲音作為一種波,頻率在20 Hz~20 kHz之間的聲音是可以被人耳識別的。人耳聽到聲音是環境中各種聲源總和,強度與聲源強度有關,也與聲源距離相關,聲波強度會隨傳播距離增加而衰減。
語音是人的發音器官發出的具有一定社會意義的聲音。語音的物理基礎主要有音高、音強、音長、音色,這也是構成語音的四要素。人發音器官包括動力部分(肺、器官、支氣管)、發聲體聲帶以及共鳴器(口腔和鼻腔),再加上每個人在生長過程中形成不同說話習慣導致每個人語音都有不同特點,可從其說話的音頻特征用于發聲者身份識別。
發明內容
本發明專利充分利用現有的語音識別、音頻處理技術,結合人工智能技術將輸入音頻信息轉化為主流智能手機控制指令,去控制各應用程序運行,程序運行的結果仍可轉化為音頻信息輸出反饋給手機操控者。
本發明專利解決其技術問題所采用的技術方案是:智能手機通過其通話的麥克風獲得外部聲音信號;再通過音頻處理技術,識別出權限身份者的語音或捕捉近人語音(距離越近,音強越大);經語音識別轉化為文字;再利用AI技術從文字中識別是否是使用者語音控制指令,并提取與手機中安裝的APP程序關聯關鍵字和參數;啟動相應APP程序,并填入參數值;程序運行結果可在手機屏幕上顯示,也可以將程序運行文字結果對應語音庫中的音頻通過手機揚聲器輸出,語音反饋給手機控制者。從而完成手機的語音控制。此外為了避免手機擁有者正常說話時被手機獲取聲音誤操作,手機上應配備一個撥動開關,只有該開關處有效狀態時,手機操作系統軟件才允許語音控制指令關聯應用程序,啟動語音控制功能,否則應屏蔽輸入聲音的音頻處理,不進行身份識別和語音文字轉化,可避免使用者再正常與人語言交流時手機誤執行指令。
采用本專利語音控制功能智能手機技術方案所涉及音頻處理技術的技術方案為預先錄取手機控制者(身份有效者)的聲音,并獲取其聲音的音頻特征。自然界中每種聲源包括不同人、動物、物體等不管聲音大小一般都有獨特音頻特點,而手機通過麥克風獲得的環境聲音轉化的模擬量是不同聲源頻率和幅度疊加總和,甚至包括手機自身揚聲器發出的聲音。現有語音處理技術已經可以把不同音源根據頻率特征區分開來,可以采用專用的語音處理芯片實現,也可以直接由手機CPU用專門軟件來處理和分析,不過用軟件實現占用手機CPU計算資源,同時實時性差。將環境聲音中區分出來的不同音頻段提取音頻特征與事先獲得有權限控制者音頻特征進行匹配,匹配成功,則識別出使用者身份,同時可將這段音頻單獨保存,用于語音識別為文字。此外也可根據聲強大小獲取近人語音音頻用于語音控制。
采用本專利語音控制功能智能手機技術方案所涉及語音文字轉化技術方案可借鑒訊飛或百度等文字輸入法程序語音識別的方案和程序,將已保存有效音頻數據采用標準音庫進行比對分析,轉化為文字,由于中文同一音可能對多個字,因此該分析程序也需一定智能化,現有的技術已能將語音文字識別率提高到一個比較高的水準。如果分析困難或音頻信息帶地方口音,手機本地程序難以準確分析時,該功能程序可通過手機自帶的WIFI功能與互聯網連接,將音頻信息推送指定的專業服務器上進行更復雜的智能分析,分析結果將音頻信息識別為文字信息再通過無線網絡反饋給手機程序進行下一步處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陳超,未經陳超許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710708957.5/2.html,轉載請聲明來源鉆瓜專利網。





