[實用新型]語音處理系統(tǒng)有效
| 申請?zhí)枺?/td> | 201720953479.X | 申請日: | 2017-08-01 |
| 公開(公告)號: | CN207149252U | 公開(公告)日: | 2018-03-27 |
| 發(fā)明(設計)人: | 李飛;程旭;趙珣;袁俊杰;呂文楊 | 申請(專利權(quán))人: | 安徽聽見科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G06F17/30 |
| 代理公司: | 北京勵誠知識產(chǎn)權(quán)代理有限公司11647 | 代理人: | 趙爽 |
| 地址: | 230088 安徽省合肥市高新區(qū)*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 系統(tǒng) | ||
1.一種語音處理系統(tǒng),其特征在于,包括:
至少第一拾音裝置和第二拾音裝置,以及用于對語音進行處理的處理裝置;
其中,所述第一拾音裝置與所述第二拾音裝置與所述處理裝置連接;
所述第一拾音裝置,用于采集第一用戶的第一語音;
所述第二拾音裝置,用于采集第二用戶的第二語音;
所述處理裝置,用于獲取所述第一語音或者所述第二語音,對所述第一語音或者所述第二語音進行識別得到對應的文字內(nèi)容以及對應的用戶,并根據(jù)所述對應的用戶分段記錄所述文字內(nèi)容。
2.根據(jù)權(quán)利要求1所述的語音處理系統(tǒng),其特征在于,還包括:
聲卡,分別與所述第一拾音裝置、所述第二拾音裝置連接以及所述處理裝置連接;
所述聲卡,用于識別當前接收到的語音對應的用戶,并將識別結(jié)果發(fā)送給所述處理裝置連接。
3.根據(jù)權(quán)利要求2所述的語音處理系統(tǒng),其特征在于,所述聲卡集成在所述第二拾音裝置中;所述第一拾音裝置通過所述第二拾音裝置與所述處理裝置連接。
4.根據(jù)權(quán)利要求1-3任一項所述的語音處理系統(tǒng),其特征在于,所述處理裝置,包括:拾音單元、轉(zhuǎn)寫單元和顯示屏;其中,所述拾音單元與所述第二拾音裝置連接,所述轉(zhuǎn)寫單元分別與所述拾音單元和顯示單元連接;
其中,所述拾音單元,用于接收所述第一語音或者所述第二語音,對接收到的語音進行拾音并進行自動降噪去混響;
所述轉(zhuǎn)寫單元,用于對由所述拾音單元處理后的所述語音進行語音識別,將所述語音中攜帶的內(nèi)容轉(zhuǎn)化成所述文字內(nèi)容并確定所述文字內(nèi)容對應的用戶,關聯(lián)所述文字內(nèi)容與對應用戶,以及根據(jù)識別出所述文字內(nèi)容對應的用戶,判斷所述文字內(nèi)容與上一段內(nèi)容是否為同一用戶,如果不是同一用戶,則分段記錄所述文字內(nèi)容;
所述顯示屏,用于顯示記錄的所述文字內(nèi)容。
5.根據(jù)權(quán)利要求4所述的語音處理系統(tǒng),其特征在于,所述轉(zhuǎn)寫單元,包括:
語音識別子單元,用于對由所述拾音單元處理后的所述語音進行語音識別,將所述語音中攜帶的內(nèi)容轉(zhuǎn)化成所述文字內(nèi)容,并從所述語音中提取聲紋特征;
對比子單元,用于將提取到的所述聲紋特征與聲紋存儲器中的聲紋特征進行比對,當 提取到的所述聲紋特征不存在于所述聲紋存儲器中,則將提取到的所述聲紋特征存儲到所述聲紋存儲器并形成用戶標記,關聯(lián)所述文字內(nèi)容與所述用戶標記;
所述聲紋存儲器,用于存儲首次提取出的所述用戶的所述聲紋特征。
6.根據(jù)權(quán)利要求4所述的語音處理系統(tǒng),其特征在于,所述處理裝置,還包括:
與所述轉(zhuǎn)寫單元和拾音單元連接的存儲單元,用于存儲接收到的所述第一語音和所述第二語音;
所述轉(zhuǎn)寫單元,還用于在記錄所述文字內(nèi)容過程中,按照句子嵌入與所述句子對應的原始語音的第一信息;其中,所述第一信息包括接收到的所述語音在所述存儲單元中的地址以及與所述句子對應的原始語音時間戳信息;
與所述轉(zhuǎn)寫單元連接的播放單元,用于當點擊所述句子時,根據(jù)所述第一信息播放所述句子對應的所述原始語音。
7.根據(jù)權(quán)利要求6所述的語音處理系統(tǒng),其特征在于,所述處理裝置,還包括:
所述轉(zhuǎn)寫單元,還用于在記錄所述文字內(nèi)容過程中,按照段落嵌入與所述段落對應的原始語音的第二信息;其中,所述第二信息包括接收到的所述語音在所述存儲單元中的地址以及與所述段落對應的原始語音時間戳信息;
與所述轉(zhuǎn)寫單元連接的關鍵詞提取單元,用于從所述文字內(nèi)容中提取關鍵詞,形成所述關鍵詞與所在段落的關聯(lián)關系;
所述播放單元,還用于查詢或者點擊到所述關鍵詞后,根據(jù)所述關聯(lián)關系和所述第二信息,播放所述關鍵詞所在段落對應的原始語音。
8.根據(jù)權(quán)利要求4所述的語音處理系統(tǒng),其特征在于,所述處理裝置,還包括:數(shù)據(jù)庫,用于存儲記錄時的文本模板和/或語句模板;
與所述轉(zhuǎn)寫單元和所述數(shù)據(jù)庫連接選取單元,用于在所述轉(zhuǎn)寫單元進行記錄之前從所有文本模板中選取一個目標文本模板,以及在記錄過程中匹配到當前語音所表述的意思第一語句模板的所表述的意思一致時,將所述第一語音模板發(fā)送給所述轉(zhuǎn)寫單元進行記錄,其中,所述第一語音模板為所述數(shù)據(jù)庫中所有語句模板中的一個。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽聽見科技有限公司,未經(jīng)安徽聽見科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201720953479.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





