[發(fā)明專(zhuān)利]中文語(yǔ)音識(shí)別系統(tǒng)及其語(yǔ)音識(shí)別方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 200810043624.6 | 申請(qǐng)日: | 2008-07-10 |
| 公開(kāi)(公告)號(hào): | CN101334999A | 公開(kāi)(公告)日: | 2008-12-31 |
| 發(fā)明(設(shè)計(jì))人: | 陳洪林 | 申請(qǐng)(專(zhuān)利權(quán))人: | 上海言海網(wǎng)絡(luò)信息技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G10L15/28 | 分類(lèi)號(hào): | G10L15/28 |
| 代理公司: | 上海光華專(zhuān)利事務(wù)所 | 代理人: | 余明偉 |
| 地址: | 200122上*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 中文 語(yǔ)音 識(shí)別 系統(tǒng) 及其 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)智能應(yīng)用技術(shù)領(lǐng)域,涉及一種語(yǔ)音識(shí)別系統(tǒng),尤其涉及一種中文語(yǔ)音識(shí)別系統(tǒng);同時(shí)還涉及一種上述中文語(yǔ)音識(shí)別系統(tǒng)的語(yǔ)音識(shí)別方法。
背景技術(shù)
語(yǔ)音識(shí)別技術(shù)在國(guó)外研究得比較早,技術(shù)相對(duì)比較成熟,在90年代就已經(jīng)開(kāi)始應(yīng)用于電信、金融等行業(yè)。比較知名語(yǔ)音識(shí)別產(chǎn)品,如Nuance語(yǔ)音識(shí)別系統(tǒng),該系統(tǒng)采用的是客戶(hù)/服務(wù)機(jī)的結(jié)構(gòu),可在Windows及很多UNIX系統(tǒng)上運(yùn)行,它可靈活伸縮,支持很小到很大的應(yīng)用程序。Nuance系統(tǒng)能夠支持大容量的語(yǔ)音檢索、自然語(yǔ)言識(shí)別等,已支持包括中文在內(nèi)的二十幾種語(yǔ)言的語(yǔ)音識(shí)別。國(guó)外的語(yǔ)音識(shí)別技術(shù)雖然已經(jīng)很成熟,但是也存在很多不足的地方,如中文語(yǔ)音識(shí)別,針對(duì)中文語(yǔ)言特點(diǎn),如自然語(yǔ)言、關(guān)鍵字、多音字等方面的處理,以及特殊的交互式語(yǔ)音要求等方面,還存在很多缺欠和不足。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是:提供一種可以有效減化語(yǔ)音交互流程、提高用戶(hù)效率的中文語(yǔ)音識(shí)別系統(tǒng)。
另外,本發(fā)明還提供一種上述中文語(yǔ)音識(shí)別系統(tǒng)的語(yǔ)音識(shí)別方法。
為解決上述技術(shù)問(wèn)題,本發(fā)明采用如下技術(shù)方案:
一種中文語(yǔ)音識(shí)別系統(tǒng),包括依次連接的語(yǔ)音數(shù)據(jù)接收單元、數(shù)模轉(zhuǎn)換單元、語(yǔ)音數(shù)據(jù)識(shí)別單元;所述語(yǔ)音數(shù)據(jù)識(shí)別單元包括:
關(guān)鍵字識(shí)別模塊,用以識(shí)別語(yǔ)音中設(shè)定特定類(lèi)型的關(guān)鍵字;
自然語(yǔ)音識(shí)別模塊,用以根據(jù)所述識(shí)別后的關(guān)鍵字辨別自然語(yǔ)言的內(nèi)容;
語(yǔ)音數(shù)據(jù)庫(kù),用以保存采樣語(yǔ)音的數(shù)據(jù)信息;
相似音識(shí)別模塊,把接收語(yǔ)音的數(shù)據(jù)信息與所述數(shù)據(jù)庫(kù)中的數(shù)據(jù)信息做比對(duì),返回結(jié)果的可信度,若可信度超過(guò)設(shè)定值,則本次識(shí)別成功;
模糊識(shí)別模塊,當(dāng)識(shí)別未獲成功時(shí),選擇若干識(shí)別率高的語(yǔ)音供用戶(hù)選擇,或者提示用戶(hù)重新發(fā)音。
作為本發(fā)明的一種優(yōu)選方案,所述語(yǔ)音數(shù)據(jù)識(shí)別單元還包括同義近義詞識(shí)別模塊,用以根據(jù)所述數(shù)據(jù)庫(kù)中的數(shù)據(jù)信息識(shí)別語(yǔ)音的同義詞及近義詞。
作為本發(fā)明的一種優(yōu)選方案,所述識(shí)別系統(tǒng)還包括與語(yǔ)音數(shù)據(jù)識(shí)別單元連接的業(yè)務(wù)流程控制單元,用以根據(jù)接收到的、來(lái)自所述語(yǔ)音數(shù)據(jù)識(shí)別單元的語(yǔ)音信息控制業(yè)務(wù)流程。
作為本發(fā)明的一種優(yōu)選方案,所述業(yè)務(wù)流程控制單元包括插話模塊,用以在業(yè)務(wù)進(jìn)行的過(guò)程中識(shí)別用戶(hù)的語(yǔ)音;進(jìn)而針對(duì)該語(yǔ)音的內(nèi)容配合用戶(hù)進(jìn)入相應(yīng)業(yè)務(wù)。
作為本發(fā)明的一種優(yōu)選方案,所述系統(tǒng)的接口符合NGN標(biāo)準(zhǔn),通過(guò)該接口直接與NGN網(wǎng)絡(luò)連接;所述系統(tǒng)包括相互分離的業(yè)務(wù)邏輯部分與呼叫控制部分。
作為本發(fā)明的一種優(yōu)選方案,所述語(yǔ)音數(shù)據(jù)接收單元設(shè)置于識(shí)別客戶(hù)端,語(yǔ)音數(shù)據(jù)識(shí)別單元設(shè)置于識(shí)別服務(wù)端;所述識(shí)別服務(wù)端把識(shí)別后的數(shù)據(jù)發(fā)送至所述識(shí)別客戶(hù)端。
作為本發(fā)明的一種優(yōu)選方案,所述語(yǔ)音識(shí)別系統(tǒng)包括:
接入層,包括平臺(tái)對(duì)接模塊與終端用戶(hù)接入模塊,平臺(tái)接入模塊支持H.323協(xié)議和SIP協(xié)議;終端用戶(hù)接入模塊支持H.323、SIP和MGCP類(lèi)型的終端注冊(cè)到TSV平臺(tái)上;
呼叫控制層,實(shí)現(xiàn)呼入呼出、呼叫狀態(tài)分析、電話轉(zhuǎn)接、錄放音、接收DTMF、轉(zhuǎn)接坐席與呼叫相關(guān)的功能,以及和計(jì)費(fèi)服務(wù)器的通信和計(jì)費(fèi)服務(wù);
會(huì)話層,主要實(shí)現(xiàn)用戶(hù)與系統(tǒng)的對(duì)話過(guò)程,包括媒體處理、語(yǔ)音識(shí)別聲音采樣、文本合成媒體輸出功能,以及與語(yǔ)音識(shí)別服務(wù)、文本合成服務(wù)的接口和交互處理;
流程解析層,主要實(shí)現(xiàn)Voice?XML的流程腳本解析功能,根據(jù)來(lái)自業(yè)務(wù)流程控制層的業(yè)務(wù)請(qǐng)求,控制著用戶(hù)的業(yè)務(wù)流程;
業(yè)務(wù)流程控制層,用以接收來(lái)自應(yīng)用服務(wù)器的業(yè)務(wù)請(qǐng)求,經(jīng)過(guò)判斷分析,將該業(yè)務(wù)請(qǐng)求交付給流程解析層處理。
上述中文語(yǔ)音識(shí)別系統(tǒng)的語(yǔ)音識(shí)別方法,包括如下步驟:
步驟A、識(shí)別客戶(hù)端中的語(yǔ)音數(shù)據(jù)接收單元采集語(yǔ)音信息;
步驟B、所述語(yǔ)音數(shù)據(jù)接收單元把采集的語(yǔ)音信息通過(guò)所述數(shù)模轉(zhuǎn)換單元轉(zhuǎn)換成數(shù)據(jù)包,發(fā)送至識(shí)別服務(wù)端中的語(yǔ)音數(shù)據(jù)識(shí)別單元;
步驟C、識(shí)別服務(wù)端識(shí)別經(jīng)過(guò)識(shí)別處理,得到識(shí)別結(jié)果,返回給識(shí)別客戶(hù)端;
步驟D、業(yè)務(wù)流程控制單元根據(jù)接收到的、來(lái)自所述語(yǔ)音數(shù)據(jù)識(shí)別單元的語(yǔ)音信息控制業(yè)務(wù)流程;
步驟D中包括模糊識(shí)別步驟,當(dāng)識(shí)別未獲成功時(shí),選擇若干識(shí)別率高的語(yǔ)音供用戶(hù)選擇,或者提示用戶(hù)重新發(fā)音。
作為本發(fā)明的一種優(yōu)選方案,所述步驟D包括識(shí)別用戶(hù)插話的步驟,在業(yè)務(wù)進(jìn)行的過(guò)程中識(shí)別用戶(hù)的語(yǔ)音,針對(duì)該語(yǔ)音的內(nèi)容配合用戶(hù)進(jìn)入相應(yīng)業(yè)務(wù)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于上海言海網(wǎng)絡(luò)信息技術(shù)有限公司,未經(jīng)上海言海網(wǎng)絡(luò)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810043624.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





