[發明專利]一種語音識別系統及其交互方法在審

申請號：	201610986916.8	申請日：	2016-11-10
公開（公告）號：	CN107123420A	公開（公告）日：	2017-09-01
發明（設計）人：	南軍	申請（專利權）人：	廈門創材健康科技有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L15/01
代理公司：	暫無信息	代理人：	暫無信息
地址：	361012 福建省廈門市湖里區自由貿易試***	國省代碼：	福建;35
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音識別系統及其交互方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及人機交互技術領域，尤其是指一種基于語音識別的方法及系統。

背景技術

人機交互技術(Human-Computer Interaction Techniques) 是指通過計算機輸入、輸出設備，以有效的方式實現人與計算機對話的技術。它包括機器通過輸出或顯示設備給人提供大量有關信息及提示請示等，人通過輸入設備給機器輸入有關信息，回答問題及提示請示等。而在傳統的人機交互系統中，人被認為是操作員，只是對機器進行操作，而無真正的交互活動。

目前語音識別只能識別單一人聲，無法識別、區分多人的聲音，在環境稍微嘈雜的環境中，就無法識別人的聲音，也無法響應，給人的感覺就是語言識別系統反應遲鈍，對于人機交互產品來說，就是無法真正為人服務，使得語音識別不能很好推廣到市場上使用。

本發明技術系統是在識別系統中，采取了一種比對評分的算法，比如按照滿分100分來評估。當采集的聲音在50分以上時，視為有效聲音，可以在語音庫中搜索、比對相關字段，并按照字段對應的反饋指令，進行相應的程序執行。在評分為零時，為環境噪音，此時，對于待機狀態的語音互動系統或者類似于語音識別，在一定時間內，從語音庫中，調取預設好的聲音片段播出。當評分在0-50分之間時，表示有微弱，嘈雜，或者多人的環境，無法識別其中的主要聲音源，因而不能執行在語言庫搜索的指令，此時，可以從特定的語音庫中，調取預設好的聲音片段播出。該分數就決定了系統語言識別的識別率，可以根據使用需求進行調整。這樣，就可以很好的解決語音互動的問題，可以給使用者有很好的體驗感。

目前語音識別和互動系統的應答聲音比較單一，都是合成的，給人以生硬的感覺，本技術很好的考慮到這個問題，給系統中提前預置多種不同人的聲音，比如兒童男聲、女聲，成年男聲、女聲等不同類型的聲音，同時，可以不斷給系統推送補充新的語音庫，豐富人們的需求。同時，在系統中解決這種聲音轉換的技術，采用RFID觸控技術，可以根據需求轉換成不同的聲音，使用方便。

發明內容

本發明解決的技術問題在于克服上述技術中存在不足，提供了一種基于語音識別的交互方法。

為解決上述技術問題，本發明采用了以下技術措施：

一種基于語音識別的交互方法，監控外部對象聲控觸發，并對采集語音與系統內部預存的語音庫進行比對評分，當分數大于一定分數則視為有效聲音，采集語音并將接收到的語音轉化成相應處理指令后傳送去進行核心處理的，當對采集語音進行評分后的分數低于一定分數時，則不進行語音轉換，繼而轉為執行其他指令后傳送去進行核心處理。接受外部RFID觸發，將觸發轉化為相應處理指令后傳送進行核心處理的步驟；觸發后，根據內部指令控制執行模塊，進行語音系統的轉換的步驟。系統內部預存的語音庫通過不斷增加錄制的聲音源進行升級，以提高系統的識別率。所述的基于語音識別的交互方法，通過對比對分數的數值大小的調整，決定著系統語音的識別率。

本發明還可以通過以下技術措施進一步完善：

采用RFID觸發方式，包括RFID觸發和/ 或OID觸發和/ 或紅外感應器件觸發。通過RFID觸發轉換的相應處理指令處理后的相應結果進行控制互動執行模塊執行聲音系統的轉換?？刂普Z音識別進行行為反應的指令包括從語音庫中提取相應的語音的步驟。其中，

聲控識別模塊，用于監控外部對象聲控觸發，采集語音并將接收到的語音轉化成相應處理指令后傳送去進行核心處理；

觸控識別模塊，包括RFID和/ 或OID和/ 或紅外感應器件，用于監控外部對象RFID觸發，將觸發轉化為相應處理指令后傳送進行核心處理；

核心處理模塊，用于實時接收聲控識別模塊及觸控識別模塊送來的外部對象觸控觸發及聲控觸發，并根據指令控制語音識別進行行為反應從而達到與外部對象實時交互；

互動執行模塊，用于接收核心處理模塊的控制而后對外部對象進行實時的行為反應。

作為進一步改進，采用了聲控識別模塊，包括，

聲學模型庫，用于存放預設聲學模型；

字典/ 詞典庫，用于存放預設的日常用語中的字、詞信息；

識別語法信息庫，用于存放預設的語言語法的信息；

識別任務的語法信息庫，用于存放不同的識別任務，對應每種識別任務設置有對應的語法信息庫；

語音檢測單元，用于將采集的語音轉換成標準格式而后通過語音檢測算法，檢測到語音的起始點和中止點；