[發(fā)明專利]語音識別裝置及方法有效
| 申請?zhí)枺?/td> | 201811079026.4 | 申請日: | 2018-09-17 |
| 公開(公告)號: | CN110910888B | 公開(公告)日: | 2022-06-14 |
| 發(fā)明(設計)人: | 孟凡;高頔;安青青;劉凌宇 | 申請(專利權)人: | 中國移動通信集團設計院有限公司;中國移動通信集團有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/28 |
| 代理公司: | 北京路浩知識產(chǎn)權代理有限公司 11002 | 代理人: | 王慶龍;李相雨 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 裝置 方法 | ||
本發(fā)明實施例提供一種語音識別裝置及方法。所述裝置包括:光源、光纖微腔、光譜儀以及處理模塊;所述光源用于向所述光纖微腔發(fā)射連續(xù)譜光;所述光纖微腔用于接收所述連續(xù)譜光以及待識別聲波;所述光譜儀用于獲取所述連續(xù)譜光經(jīng)過所述光纖微腔并發(fā)生諧振時的原始諧振參數(shù),以及獲取所述連續(xù)譜光以及待識別聲波同時經(jīng)過所述光纖微腔,并發(fā)生諧振時的調制諧振參數(shù);所述處理模塊用于根據(jù)所述原始諧振參數(shù)以及調制諧振參數(shù),得到所述待識別聲波的聲波參數(shù);根據(jù)所述聲波參數(shù)與預設的聲波模板進行匹配,得到所述待識別聲波的文本信息。本發(fā)明解決了現(xiàn)有技術中,進一步提升語音識別產(chǎn)品的識別率,會花費更長時間和成本的問題。
技術領域
本發(fā)明實施例涉及語音識別技術領域,尤其涉及一種語音識別裝置及方法。
背景技術
隨著人工智能(Artificial Intelligence,AI)技術的逐漸興起,語音識別作為AI領域的一個重要分支也發(fā)展迅速。語音識別改變了人與機器交互的傳統(tǒng)模式,通過特征提取、模型建立以及模式匹配等技術操作,將人類語言直接與機器進行通信,提供了更加便捷的用戶體驗。
具體地,語音識別是一種深度算法技術,主要涉及聲學模型和語言模型的建立和優(yōu)化,在保證聲學模型符合要求的前提下用語言模型進行深度計算及優(yōu)化。然而,目前,語音識別產(chǎn)品的識別率已經(jīng)到達一個瓶頸狀態(tài),已接近于人類語音識別極限,更進一步提升會花費更長時間和成本。為了解決這個問題,一些生產(chǎn)廠家以屏幕交互的方式來彌補這種不足,但由于語音識別的聲學模型結構單一、標準嚴格,屏幕交互的方式會造成整個產(chǎn)品結構的復雜,同時不適用于人體習慣性操作,靈活性和用戶體驗感較差。
發(fā)明內容
本發(fā)明實施例提供一種語音識別裝置及方法,用以解決現(xiàn)有技術中,進一步提升語音識別產(chǎn)品的識別率,會花費更長時間和成本的問題。
一方面,本發(fā)明實施例提供一種語音識別裝置,所述裝置包括:光源、光纖微腔、光譜儀以及處理模塊;
所述光源用于向所述光纖微腔發(fā)射連續(xù)譜光;
所述光纖微腔用于接收所述連續(xù)譜光以及待識別聲波;其中,所述光纖微腔表面覆蓋有在受到聲波和/或光波調制時發(fā)生形變的石墨烯膜;
所述光譜儀用于獲取所述連續(xù)譜光經(jīng)過所述光纖微腔并發(fā)生諧振時的原始諧振參數(shù),以及獲取所述連續(xù)譜光以及待識別聲波同時經(jīng)過所述光纖微腔,并發(fā)生諧振時的調制諧振參數(shù);其中,諧振參數(shù)至少包括波長以及諧振時刻;
所述處理模塊用于根據(jù)所述原始諧振參數(shù)以及調制諧振參數(shù),得到所述待識別聲波的聲波參數(shù);其中,所述聲波參數(shù)至少包括振幅以及頻率;
根據(jù)所述聲波參數(shù)與預設的聲波模板進行匹配,得到所述待識別聲波的文本信息。
另一方面,本發(fā)明實施例提供一種語音識別方法,應用于上述語音識別裝置,所述方法包括:
控制所述語音識別裝置的光源向所述語音識別裝置的光纖微腔發(fā)射連續(xù)譜光;
獲取所述連續(xù)譜光經(jīng)過所述光纖微腔并發(fā)生諧振時的原始諧振參數(shù),以及獲取所述連續(xù)譜光以及待識別聲波同時經(jīng)過所述光纖微腔,并發(fā)生諧振時的調制諧振參數(shù);其中,諧振參數(shù)至少包括波長以及諧振時刻;
根據(jù)所述原始諧振參數(shù)以及調制諧振參數(shù),得到所述待識別聲波的聲波參數(shù);其中,所述聲波參數(shù)至少包括振幅以及頻率;
根據(jù)所述聲波參數(shù)與預設的聲波模板進行匹配,得到所述待識別聲波的文本信息。
另一方面,本發(fā)明實施例還提供了一種電子設備,包括存儲器、處理器、總線以及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)上述語音識別方法中的步驟。
再一方面,本發(fā)明實施例還提供了一種非暫態(tài)計算機可讀存儲介質,其上存儲有計算機程序,所述程序被處理器執(zhí)行時實現(xiàn)上述語音識別方法中的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團設計院有限公司;中國移動通信集團有限公司,未經(jīng)中國移動通信集團設計院有限公司;中國移動通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811079026.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





