[發(fā)明專利]語音智能交互系統(tǒng)無效
| 申請?zhí)枺?/td> | 201010229815.9 | 申請日: | 2010-07-16 |
| 公開(公告)號: | CN102339604A | 公開(公告)日: | 2012-02-01 |
| 發(fā)明(設計)人: | 張學政 | 申請(專利權(quán))人: | 西安歐博科工貿(mào)有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G11C7/16 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 710065 陜西省西安市*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 智能 交互 系統(tǒng) | ||
技術(shù)領(lǐng)域:
本發(fā)明涉及一種能夠進行多級語音對話的人機對話的智能感觸語音對話和定時播放學習系統(tǒng),具體涉及一種微型SD卡存儲方案語音智能交互系統(tǒng)。
背景技術(shù):
語音識別技術(shù),也被稱為自動語音識別Automatic?Speech?Recognition(ASR),其目標是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。與說話人識別及說話人確認不同,后者嘗試識別或確認發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。語音識別技術(shù)的應用包括語音撥號、語音導航、室內(nèi)設備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。語音識別技術(shù)與其他自然語言處理技術(shù)如機器翻譯及語音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復雜的應用,例如語音到語音的翻譯。語音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。
在電話與通信系統(tǒng)中,智能語音接口正在把電話機從一個單純的服務工具變成為一個服務的“提供者”和生活“伙伴”;使用電話與通信網(wǎng)絡,人們可以通過語音命令方便地從遠端的數(shù)據(jù)庫系統(tǒng)中查詢與提取有關(guān)的信息;隨著計算機的小型化,鍵盤已經(jīng)成為移動平臺的一個很大障礙,想象一下如果手機僅僅只有一個手表那么大,再用鍵盤進行撥號操作已經(jīng)是不可能的。語音識別正逐步成為信息技術(shù)中人機接口的關(guān)鍵技術(shù),語音識別技術(shù)與語音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤,通過語音命令進行操作。語音技術(shù)的應用已經(jīng)成為一個具有競爭性的新興高技術(shù)產(chǎn)業(yè)。
隨著應用領(lǐng)域的擴大,小詞匯表、特定人、孤立詞等這些對語音識別的約束條件需要放寬,與此同時也帶來了許多新的問題:第一,詞匯表的擴大使得模板的選取和建立發(fā)生困難;第二,連續(xù)語音中,各個音素、音節(jié)以及詞之間沒有明顯的邊界,各個發(fā)音單位存在受上下文強烈影響的協(xié)同發(fā)音(Co-articulation)現(xiàn)象;第三,非特定人識別時,不同的人說相同的話相應的聲學特征有很大的差異,即使相同的人在不同的時間、生理、心理狀態(tài)下,說同樣內(nèi)容的話也會有很大的差異;第四,識別的語音中有背景噪聲或其他干擾。因此原有的模板匹配方法已不再適用。
發(fā)明內(nèi)容:
本發(fā)明的目的是提供一種語音智能交互系統(tǒng),它能定時播放啟動學習或娛樂內(nèi)容,廣泛應用在工礦企業(yè)、事業(yè)單位、學校、家庭等,減少人力資源投入。語音內(nèi)容具備隨時更新的功能,同時使得一部機器通過SD卡內(nèi)容的變換而使得產(chǎn)品應用變換,結(jié)構(gòu)簡單、計算能力強、識別率高、抗噪性能好、錄/放音質(zhì)量高、互動性強、可自由下載升級。
為了解決背景技術(shù)所存在的問題,本發(fā)明是采用以下技術(shù)方案:它包含內(nèi)容存儲播放模塊1、語音麥克風采集器2、啟動裝置模塊3、播放系統(tǒng)4、語音識別處理芯片5,語音識別處理芯片5和語音麥克風采集器2與內(nèi)容存儲播放模塊1連接,內(nèi)容存儲播放模塊1與播放系統(tǒng)4連接,啟動裝置模塊3與內(nèi)容存儲播放模塊1相互連接。
所述的內(nèi)容存儲播放模塊1可以外接SD卡,并且連接有語音識別處理芯片5。內(nèi)容存儲播放模塊1內(nèi)有多達18種存儲節(jié)目,如:學習內(nèi)容(歷史、文學等)、娛樂節(jié)目(相聲、小品等)、對話節(jié)目(英語欄目等)。每種存儲大類中科存放300個以上的節(jié)目,外部的SD卡最多可達3000個以上節(jié)目條,可以在玩中掌握學習知識,涵蓋生活的方方面面。
所述的啟動裝置模塊3包含感應器a、感應器b和感應器c。啟動裝置模塊3可以安裝在車座及腳墊下、家具、天花板等部位,達到車載、家具用的目的。
所述的播放系統(tǒng)4與汽車影音系統(tǒng)或家庭音響系統(tǒng)的語音識別處理芯片及處理器連接,它可以進行定時播放節(jié)目設置。本發(fā)明使用到車載音樂播放后,以語言控制節(jié)目播放,比現(xiàn)在的MP3更富趣味性,同時省去手動控制MP3的過程,有效降低駕駛事故發(fā)生。
本發(fā)明應用在車載、家居、娛樂、學習方面時的工作原理是:將音頻信號轉(zhuǎn)換為調(diào)頻信號無線發(fā)射到車內(nèi)音響系統(tǒng),只需要將產(chǎn)品語音識別處理芯片(發(fā)射器)插入汽車點煙器座,(并將耳機插頭插入播放器耳機輸出插孔),然后打開汽車收音機并設定到播放機所發(fā)射的頻點就能開始工作了;或通過連接線傳送到家庭音響系統(tǒng)直接進行播放。
本發(fā)明應用在兒童早教或?qū)W習產(chǎn)品中時直接內(nèi)置喇叭,能實現(xiàn)早晚定時播放啟動學習或娛樂內(nèi)容,同時也可廣泛應用在工礦企業(yè)、事業(yè)單位、學校、家庭及旅游導游、酒店客房、公共場所等系統(tǒng)語音服務等,減少人力資源投入。語音內(nèi)容具備隨時更新應用領(lǐng)域的功能,同時使得一部機器通過SD卡內(nèi)容的變換而使得產(chǎn)品本質(zhì)變換,結(jié)構(gòu)簡單、趣味性互動性強、計算能力強、識別率高、抗噪性能好、錄/放音質(zhì)量高、互動性強、可自由下載升級。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安歐博科工貿(mào)有限公司,未經(jīng)西安歐博科工貿(mào)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010229815.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





