[發(fā)明專利]一種多人文本語音轉(zhuǎn)換裝置及方法在審
| 申請?zhí)枺?/td> | 202010949442.6 | 申請日: | 2020-09-10 |
| 公開(公告)號: | CN112102809A | 公開(公告)日: | 2020-12-18 |
| 發(fā)明(設(shè)計(jì))人: | 李強(qiáng);喬文霞;李志 | 申請(專利權(quán))人: | 北方民族大學(xué) |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/04;G10L13/08;G10L15/26;G10L17/02 |
| 代理公司: | 北京方圓嘉禾知識產(chǎn)權(quán)代理有限公司 11385 | 代理人: | 程華 |
| 地址: | 750021 寧夏回族*** | 國省代碼: | 寧夏;64 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 人文 語音 轉(zhuǎn)換 裝置 方法 | ||
本發(fā)明公開了一種多人文本語音轉(zhuǎn)換裝置及方法,該裝置包括麥克風(fēng)設(shè)備、鍵鼠及手寫板、智能音箱設(shè)備和接收設(shè)備;所述麥克風(fēng)設(shè)備用于接收用戶發(fā)出的語音信息;所述鍵鼠及手寫板用于傳輸用戶的文本信息;所述智能音箱設(shè)備用于傳出經(jīng)語音合成系統(tǒng)將文本信息轉(zhuǎn)換成的語音信息;所述接收設(shè)備用于接收用戶傳遞的語音信息轉(zhuǎn)換成的文本信息。本發(fā)明還公開了一種多人文本語音轉(zhuǎn)換方法。本發(fā)明在多人協(xié)同語音辦公場景下,用戶根據(jù)現(xiàn)有設(shè)備及所處環(huán)境選擇適合的交互設(shè)備,不同交互設(shè)備用戶所述的語音信息、文本信息或者語音和文本兩種信息都存在的情況下,通過文本語音后臺(tái)服務(wù)器完成文本語音之間的轉(zhuǎn)換,使得多人之間的交互更加自然友好,從而提高工作效率。
技術(shù)領(lǐng)域
本發(fā)明屬于智能語音交互技術(shù)領(lǐng)域,涉及一種多人文本語音轉(zhuǎn)換裝置及方法。
背景技術(shù)
目前,語音識別技術(shù)廣泛應(yīng)用于人機(jī)交互領(lǐng)域中,現(xiàn)有的語音識別技術(shù)能夠準(zhǔn)確地和快速地識別語音信號對應(yīng)的發(fā)言對象以及語音信號本身地含義,這極大地推動(dòng)了人機(jī)交互的應(yīng)用和發(fā)展。隨著智能設(shè)備的普及,目前大多數(shù)智能設(shè)備(智能手機(jī),智能音箱等)具有自動(dòng)發(fā)音功能,但是目前大部分智能設(shè)備只能單純地發(fā)出機(jī)器聲音,對于需要通過智能設(shè)備進(jìn)行語音交互的用戶來說,機(jī)器聲音比較單調(diào)乏味,聽起來沒有自然語言那樣生動(dòng)形象,且過于生硬,并不能體現(xiàn)出用戶本身的特色。除此之外,在協(xié)同辦公場景下,目前用戶對于所述語音信息、文本信息或者文本和語音兩種信息都存在的情況下對信息的存儲(chǔ)管理不夠完善。
綜上所述,現(xiàn)有技術(shù)存在的問題是:在協(xié)同辦公場景下,如何實(shí)現(xiàn)個(gè)性化的語音合成以及完善對信息的存儲(chǔ)管理,使得用戶之間的交流自然友好,高效完成辦公任務(wù)。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中存在的缺陷,提供一種多人文本語音轉(zhuǎn)換裝置及方法,該技術(shù)方案旨在多人協(xié)同語音辦公場景下,用戶在身份確認(rèn)之后可以根據(jù)現(xiàn)有設(shè)備及所處環(huán)境選擇適合的交互設(shè)備,根據(jù)不同交互設(shè)備用戶所述的語音信息、文本信息或者語音和文本兩種信息都存在的情況下,可以通過文本-語音后臺(tái)服務(wù)器完成文本-語音之間的轉(zhuǎn)換,使得多人之間的交互更加自然友好,從而提高工作效率。
其技術(shù)方案如下:
一種多人文本語音轉(zhuǎn)換裝置,包括麥克風(fēng)設(shè)備、鍵鼠及手寫板、智能音箱設(shè)備和接收設(shè)備;
所述麥克風(fēng)設(shè)備,用于接收用戶發(fā)出的語音信息;
所述鍵鼠及手寫板,用于傳輸用戶的文本信息;
所述智能音箱設(shè)備,用于傳出經(jīng)語音合成系統(tǒng)將文本信息轉(zhuǎn)換成的語音信息;
所述接收設(shè)備,用于接收用戶傳遞的語音信息轉(zhuǎn)換成的文本信息。
進(jìn)一步,所述接收設(shè)備包括顯示器設(shè)備、平板電腦、筆記本電腦、智能手表和其他(智能汽車等)。
進(jìn)一步,還包括存儲(chǔ)管理模塊,所述存儲(chǔ)管理模塊包括文本數(shù)據(jù)庫、語音數(shù)據(jù)庫和個(gè)人資料庫,所述文本數(shù)據(jù)庫和語音數(shù)據(jù)庫之間通過語音、人物、文本的關(guān)系連接在一起;
所述文本數(shù)據(jù)庫,用于存儲(chǔ)用戶鍵鼠或觸屏方式傳輸?shù)奈谋拘畔⒒蛘呓?jīng)過語音識別將語音信息轉(zhuǎn)換成的文本信息;
所述語音數(shù)據(jù)庫,用于存儲(chǔ)來自用戶麥克風(fēng)的語音信息。
進(jìn)一步,還包括麥克風(fēng)語音信息融合模塊,所述麥克風(fēng)語音信息融合模塊包括麥克風(fēng)信息采集、語音信息增強(qiáng)和語音信息存儲(chǔ)格式;
所述麥克風(fēng)采集信息,調(diào)用不同設(shè)備的麥克風(fēng)采集用戶語音信息;
所述語音信息增強(qiáng),用于對不同設(shè)備采集到的不同頻率的語音信息進(jìn)行降噪和融合,
使得用戶通過音箱接收到的語音信息更加清晰;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北方民族大學(xué),未經(jīng)北方民族大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010949442.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 圖像轉(zhuǎn)換設(shè)備、圖像轉(zhuǎn)換電路及圖像轉(zhuǎn)換方法
- 數(shù)模轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 轉(zhuǎn)換設(shè)備和轉(zhuǎn)換方法
- 占空比轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 通信轉(zhuǎn)換方法、轉(zhuǎn)換裝置及轉(zhuǎn)換系統(tǒng)
- 模數(shù)轉(zhuǎn)換和模數(shù)轉(zhuǎn)換方法
- 轉(zhuǎn)換模塊以及轉(zhuǎn)換電路
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件和熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊





