[發(fā)明專利]一種用于電腦的語音轉(zhuǎn)化文字的輸入系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 201810930806.9 | 申請日: | 2018-08-15 |
| 公開(公告)號: | CN109036423A | 公開(公告)日: | 2018-12-18 |
| 發(fā)明(設(shè)計)人: | 余愛春 | 申請(專利權(quán))人: | 信利半導(dǎo)體有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L17/00;G10L17/04;G10L21/0208 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 廖苑濱 |
| 地址: | 516600 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音數(shù)據(jù) 文字轉(zhuǎn)換單元 結(jié)果對比 輸入系統(tǒng) 文字轉(zhuǎn)化 語音轉(zhuǎn)化 轉(zhuǎn)化 截取 語音 錯誤糾正單元 輸入處理單元 鍵盤輸入 結(jié)果數(shù)據(jù) 濾波處理 輸出單元 語音轉(zhuǎn)換 錯誤率 人工的 聲音庫 準(zhǔn)確率 電腦 錯位 查找 轉(zhuǎn)換 成功 | ||
1.一種用于電腦的語音轉(zhuǎn)化文字的輸入系統(tǒng),其特征在于,所述系統(tǒng)包括:
語音輸入處理單元,用于觸發(fā)錄入語音數(shù)據(jù),并對語音數(shù)據(jù)進(jìn)行濾波;
多個文字轉(zhuǎn)換單元,用于把語音數(shù)據(jù)轉(zhuǎn)化為文字;
結(jié)果對比找錯單元,用于把每個文字轉(zhuǎn)換單元轉(zhuǎn)化的文字進(jìn)行對比,找出區(qū)別部分文字,根據(jù)區(qū)別部分文字,截取相應(yīng)的語音返回多個文字轉(zhuǎn)換單元中二次轉(zhuǎn)化,把二次轉(zhuǎn)化文字與原轉(zhuǎn)化文字匹配得到轉(zhuǎn)化文字;
及文字輸出單元,用于接收結(jié)果對比找錯單元輸出入的轉(zhuǎn)化文字,把轉(zhuǎn)化文字輸入外部電腦系統(tǒng)。
2.根據(jù)權(quán)利要求1所述的一種用于電腦的語音轉(zhuǎn)化文字的輸入系統(tǒng),其特征在于,所述系統(tǒng)還包括:
人工錯誤糾正單元,用于把結(jié)果對比找錯單元進(jìn)行二次轉(zhuǎn)化對比后匹配度仍低于百分之五十的文字進(jìn)行人工聽取相應(yīng)的語音,人工根據(jù)語音輸入文字,把輸入文字傳給文字輸出單元。
3.根據(jù)權(quán)利要求2所述的一種用于電腦的語音轉(zhuǎn)化文字的輸入系統(tǒng),其特征在于:所述語音輸入處理單元包括:
語音檢測觸發(fā)模塊,用于檢測是否有語音數(shù)據(jù),當(dāng)有語音數(shù)據(jù)時,觸發(fā)系統(tǒng)開啟工作模式;
語音錄入模塊,用于錄入語音數(shù)據(jù);
及語音模型濾波模塊,用于根究語音模型進(jìn)行對語音錄入模塊傳入的語音數(shù)據(jù)進(jìn)行濾波處理。
4.根據(jù)權(quán)利要求3所述的 一種用于電腦的語音轉(zhuǎn)化文字的輸入系統(tǒng),其特征在于:所述語音檢測觸發(fā)模塊的具體工作過程為:
通過聲音感應(yīng)器感應(yīng)是否有聲音,當(dāng)有聲音時,通過人聲特征識別模型識別聲音是否為人類語音,當(dāng)識別位人類語音時,啟動系統(tǒng)開關(guān),語音錄入模塊開始錄入語音數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的一種用于電腦的語音轉(zhuǎn)化文字的輸入系統(tǒng),其特征在于:所述多個文字轉(zhuǎn)換單元中,每個文字轉(zhuǎn)換單元均包括:
語音特征向量提取模塊,用于對語音數(shù)據(jù)進(jìn)行聲音特征量提取;
聲音庫模塊,用于存儲進(jìn)行模型化的聲音數(shù)據(jù);
聲學(xué)相似度計算模塊,用于把語音特征向量提取模塊提取的聲音特征量與聲音庫模塊內(nèi)的模型化的聲音數(shù)據(jù)對比,匹配相似度的聲音數(shù)據(jù);
文字語音庫模塊,用于存儲文字、文字對應(yīng)的語音和文字?jǐn)U展詞句的語音數(shù)據(jù);
文字識別模塊,把聲學(xué)相似度計算模塊傳入的聲音數(shù)據(jù)與文字語音庫模塊內(nèi)的語音數(shù)據(jù)進(jìn)行對比匹配,得出語音轉(zhuǎn)化的文字。
6.根據(jù)權(quán)利要求5所述的一種用于電腦的語音轉(zhuǎn)化文字的輸入系統(tǒng),其特征在于:所述文字識別模塊進(jìn)行對比匹配的過程為:
把一個語音特征量與文字語音庫模塊中的語音進(jìn)行匹配,得到匹配相似度排前的三個語音數(shù)據(jù),然后再對語音特征量前后的語音特征量與文字語音庫模塊中的語音進(jìn)行匹配,得到匹配相似度排前的三個語音數(shù)據(jù),然后把語音數(shù)據(jù)對應(yīng)的文字匹配,得到轉(zhuǎn)化的文字。
7.根據(jù)權(quán)利要求6所述的一種用于電腦的語音轉(zhuǎn)化文字的輸入系統(tǒng),其特征在于,所述結(jié)果對比找錯單元包括:
文字比對模塊,用于接收多個文字轉(zhuǎn)換單元輸出的轉(zhuǎn)化文字,把每個文字轉(zhuǎn)換單元輸出的文字相互之間對比,查找每個文字轉(zhuǎn)換單元輸出的轉(zhuǎn)化文字與其它的文字轉(zhuǎn)換單元輸出的轉(zhuǎn)化文字不同區(qū)域;
區(qū)別文字對比模塊,用于把文字比對模塊輸出的不同區(qū)域的轉(zhuǎn)化文字進(jìn)行相同站隊(duì)求占比;
錯誤文字選定模塊,用于根據(jù)區(qū)別文字對比模塊輸出的占比數(shù)據(jù),確定轉(zhuǎn)化錯誤部分文字,并確定錯誤文字語音位置,
錯誤文字語音截取模塊,用于根據(jù)錯誤文字選定模塊輸出的錯誤文字語音位置對語音數(shù)據(jù)進(jìn)行截取,并把截取的語音數(shù)據(jù)傳回給多個文字轉(zhuǎn)換單元二次轉(zhuǎn)化;
及錯誤糾正模塊,用于選定二次轉(zhuǎn)化后均未能轉(zhuǎn)化正確的文字,并對沒能轉(zhuǎn)化正確的文字根據(jù)語音量標(biāo)注拼音,同時截取相應(yīng)文字位置的語音數(shù)據(jù)。
8.根據(jù)權(quán)利要求1所述的一種用于電腦的語音轉(zhuǎn)化文字的輸入系統(tǒng),其特征在于:所述二次轉(zhuǎn)化的具體過程與初始轉(zhuǎn)化的過程相同。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于信利半導(dǎo)體有限公司,未經(jīng)信利半導(dǎo)體有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810930806.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 導(dǎo)航系統(tǒng)
- 一種語音檢測方法和系統(tǒng)
- 語音數(shù)據(jù)庫創(chuàng)建方法、聲紋注冊方法、裝置、設(shè)備及介質(zhì)
- 即時聊天中語音數(shù)據(jù)的摘要生成方法、服務(wù)器及系統(tǒng)
- 一種語音智能識別設(shè)備及語音智能識別方法
- 語音數(shù)據(jù)的獲取方法和系統(tǒng)
- 一種語音數(shù)據(jù)處理方法及裝置
- 語音數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種語音數(shù)據(jù)主題識別的方法及裝置
- 語音喚醒方法、裝置、系統(tǒng)、設(shè)備和存儲介質(zhì)
- 一種地層對比結(jié)果整合方法及裝置
- 詞語匹配方法、裝置、設(shè)備及計算機(jī)可讀存儲介質(zhì)
- 一種復(fù)合墻結(jié)構(gòu)抗震性能測試系統(tǒng)及方法
- 廣告數(shù)據(jù)對比分析方法、裝置、電子設(shè)備和存儲介質(zhì)
- 一種關(guān)系型數(shù)據(jù)庫數(shù)據(jù)對比方法及系統(tǒng)
- 一種液晶面板的檢測方法和液晶面板
- 確定人臉對比結(jié)果的方法及裝置
- 一種基于多項(xiàng)對比的財務(wù)數(shù)據(jù)整合系統(tǒng)的工作方法
- 一種發(fā)明專利在線分析系統(tǒng)
- 一種圖模對比方法及裝置





