[發(fā)明專利]一種語音識別方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201810063257.X | 申請日: | 2018-01-23 |
| 公開(公告)號: | CN108281144B | 公開(公告)日: | 2020-12-08 |
| 發(fā)明(設(shè)計)人: | 溫正靠 | 申請(專利權(quán))人: | 浙江國視科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/22;G10L15/20;G06F16/903;G06F16/33 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 王戈 |
| 地址: | 325005 浙江省溫州*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 識別 方法 系統(tǒng) | ||
本發(fā)明公開一種語音識別方法和系統(tǒng)。方法包括:獲取各個操作對象的結(jié)構(gòu)體;將人發(fā)出的語音錄制成音頻文件傳輸?shù)椒掌鳎R別成文字;將文字轉(zhuǎn)變?yōu)樽址?;獲取所有符合字符串的操作對象,計算匹配值,獲取匹配值最高的操作對象;獲取所有符合字符串的操作指令,計算匹配值,獲取匹配值最高的操作指令;操作指令為左向操作指令、右向操作指令兩個操作指令中至少一者;將匹配值最高的操作對象和匹配值最高的操作指令進行組合;判斷組合中的操作對象是否為N個,判斷操作對象是否具有并列關(guān)系以及判斷所述操作對象的操作指令是否同時具有左向操作指令和右向操作指令。本發(fā)明的方法或系統(tǒng)能夠?qū)崿F(xiàn)多對象多操作的語音識別,大幅提高語音識別的精度。
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別領(lǐng)域,特別是涉及一種語音識別方法和系統(tǒng)。
背景技術(shù)
目前市面上,語音識別的產(chǎn)品非常多,例如科大訊飛、百度語音識別等,但是他們識別的內(nèi)容需要描述地非常準確才能識別得到,舉個例子:“打開空調(diào)”,這句話基本上所有的智能語音識別系統(tǒng)都能夠輕松識別,因為結(jié)構(gòu)簡單,僅包含一個操作指令“打開”+操作對象“空調(diào)”,但是如果說“哎呀太熱了,我想打開空調(diào),把加濕器也打開”,基本上所有的識別軟件都手足無措了,可能有些能識別出其中的某一個操作,不過基本上沒有任何一個識別軟件能識別出所有的內(nèi)容。
目前的語音識別技術(shù)無法做到多對象多操作的語音識別,這種傳統(tǒng)識別方式的缺點顯而易見,話術(shù)要求固定、無法在嘈雜的環(huán)境下識別語音。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種語音識別方法和系統(tǒng),能夠?qū)崿F(xiàn)多對象多操作的識別,允許用戶說出操作指令與操作對象的同時,加入一些其他無關(guān)的內(nèi)容,話術(shù)上更加自由,同時在嘈雜的環(huán)境下,大幅提高語音識別的精度。
為實現(xiàn)上述目的,本發(fā)明提供了如下方案:
一種語音識別方法,所述語音識別方法包括:
獲取各個操作對象的結(jié)構(gòu)體,將所述結(jié)構(gòu)體存儲在數(shù)據(jù)庫中;
將人發(fā)出的語音指令錄制成音頻文件傳輸?shù)椒掌?,識別成文字;
將所述文字轉(zhuǎn)變?yōu)槭鬃帜钙唇拥牡谝蛔址腿醋帜钙唇拥牡诙址⑺龅谝蛔址退龅诙址M行模糊處理;
從數(shù)據(jù)庫中使用索引方法獲取所有符合所述第一字符串和所述第二字符串的操作對象;計算所述操作對象的匹配值,獲取所述匹配值最高的操作對象;
從數(shù)據(jù)庫中使用索引方法獲取所有符合所述第一字符串和所述第二字符串的操作指令;計算所述操作指令的匹配值,獲取所述匹配值最高的操作指令;所述操作指令為左向操作指令、右向操作指令兩個操作指令中至少一者;
將所述匹配值最高的操作對象和所述匹配值最高的操作指令進行組合;
判斷所述組合中的操作對象是否為N個,N為大于1的正整數(shù),若是,則判斷所述操作對象間是否具有并列關(guān)系,若是,則所述匹配值最高的操作對象執(zhí)行的操作指令為前一個識別出的操作對象的操作指令并判斷所述操作指令是否同時具有左向操作指令和右向操作指令,若否,則判斷所述操作對象的操作指令是否同時具有左向操作指令和右向操作指令;
若所述組合中的操作對象為1個,則直接判斷所述操作對象的操作指令是否同時具有左向操作指令和右向操作指令;
若所述操作對象的操作指令同時具有左向操作指令和右向操作指令,則對所述操作對象執(zhí)行右向操作指令;
若所述操作對象的操作指令只具有一個操作指令,則對所述操作對象執(zhí)行當前識別的操作指令。
可選的,所述從數(shù)據(jù)庫中使用索引方法獲取所有符合所述第一字符串和所述第二字符串的操作對象;計算所述操作對象的匹配值,獲取所述匹配值最高的操作對象,具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江國視科技有限公司,未經(jīng)浙江國視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810063257.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





