[發(fā)明專利]用于關(guān)聯(lián)語音數(shù)據(jù)和檢索語音數(shù)據(jù)的方法、裝置、電子設(shè)備和可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110539769.0 | 申請日: | 2021-05-18 |
| 公開(公告)號: | CN113299279A | 公開(公告)日: | 2021-08-24 |
| 發(fā)明(設(shè)計)人: | 黃杰輝;徐世超;李健;梁志婷 | 申請(專利權(quán))人: | 上海明略人工智能(集團(tuán))有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/08;G10L15/26 |
| 代理公司: | 北京康盛知識產(chǎn)權(quán)代理有限公司 11331 | 代理人: | 陶俊潔 |
| 地址: | 200000 上海市徐匯區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 關(guān)聯(lián) 語音 數(shù)據(jù) 檢索 方法 裝置 電子設(shè)備 可讀 存儲 介質(zhì) | ||
1.一種用于關(guān)聯(lián)語音數(shù)據(jù)的方法,其特征在于,包括:
獲取對話語音數(shù)據(jù);所述對話語音數(shù)據(jù)帶有第一斷句標(biāo)記信息;
根據(jù)所述第一斷句標(biāo)記信息將所述對話語音數(shù)據(jù)分割成若干個語音片段數(shù)據(jù);獲取所述對話語音數(shù)據(jù)對應(yīng)的對話文本數(shù)據(jù),所述對話文本數(shù)據(jù)包括第二斷句標(biāo)記信息;
根據(jù)所述第二斷句標(biāo)記信息將所述對話文本數(shù)據(jù)分割成若干個文本片段數(shù)據(jù);所述文本片段數(shù)據(jù)的數(shù)量與所述語音片段數(shù)據(jù)的數(shù)量相同;
將所述文本片段數(shù)據(jù)與所述語音片段數(shù)據(jù)關(guān)聯(lián)存儲在預(yù)設(shè)的語音片段數(shù)據(jù)庫。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取對話語音數(shù)據(jù),包括:
獲取錄音數(shù)據(jù);
去除所述錄音數(shù)據(jù)中的靜默片段,獲得對話語音數(shù)據(jù)。
3.一種用于檢索語音數(shù)據(jù)的方法,其特征在于,包括:
獲取檢索關(guān)鍵詞;
獲取所述檢索關(guān)鍵詞對應(yīng)的文本片段數(shù)據(jù);
在預(yù)設(shè)的語音片段數(shù)據(jù)庫中匹配出所述文本片段數(shù)據(jù)對應(yīng)的語音片段數(shù)據(jù);所述語音片段數(shù)據(jù)庫中存儲有文本片段數(shù)據(jù)和語音片段數(shù)據(jù)的關(guān)聯(lián)關(guān)系。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述語音片段數(shù)據(jù)庫通過以下方式獲取:
獲取對話語音數(shù)據(jù);所述對話語音數(shù)據(jù)帶有第一斷句標(biāo)記信息;
根據(jù)所述第一斷句標(biāo)記信息將所述對話語音數(shù)據(jù)分割成若干個語音片段數(shù)據(jù);獲取所述對話語音數(shù)據(jù)對應(yīng)的對話文本數(shù)據(jù),所述對話文本數(shù)據(jù)包括第二斷句標(biāo)記信息;
根據(jù)所述第二斷句標(biāo)記信息將所述對話文本數(shù)據(jù)分割成若干個文本片段數(shù)據(jù);所述文本片段數(shù)據(jù)的數(shù)量與所述語音片段數(shù)據(jù)的數(shù)量相同;
將所述文本片段數(shù)據(jù)與所述語音片段數(shù)據(jù)關(guān)聯(lián)存儲在預(yù)設(shè)的語音片段數(shù)據(jù)庫。
5.一種用于關(guān)聯(lián)語音數(shù)據(jù)的裝置,其特征在于,包括:
第一獲取模塊,被配置為獲取對話語音數(shù)據(jù);所述對話語音數(shù)據(jù)帶有第一斷句標(biāo)記信息;
第一分割模塊,被配置為根據(jù)所述第一斷句標(biāo)記信息將所述對話語音數(shù)據(jù)分割成若干個語音片段數(shù)據(jù);
第二獲取模塊,被配置為獲取所述對話語音數(shù)據(jù)對應(yīng)的對話文本數(shù)據(jù),所述對話文本數(shù)據(jù)包括第二斷句標(biāo)記信息;
第二分割模塊,被配置為根據(jù)所述第二斷句標(biāo)記信息將所述對話文本數(shù)據(jù)分割成若干個文本片段數(shù)據(jù);所述文本片段數(shù)據(jù)的數(shù)量與所述語音片段數(shù)據(jù)的數(shù)量相同;
存儲模塊,被配置為將所述文本片段數(shù)據(jù)與所述語音片段數(shù)據(jù)關(guān)聯(lián)存儲在預(yù)設(shè)的語音片段數(shù)據(jù)庫。
6.一種用于檢索語音數(shù)據(jù)的裝置,其特征在于,包括:
第三獲取模塊,被配置為獲取檢索關(guān)鍵詞;
第四獲取模塊,被配置為獲取所述檢索關(guān)鍵詞對應(yīng)的文本片段數(shù)據(jù);
匹配模塊,被配置為在預(yù)設(shè)的語音片段數(shù)據(jù)庫中匹配出所述文本片段數(shù)據(jù)對應(yīng)的語音片段數(shù)據(jù);所述語音片段數(shù)據(jù)庫中存儲有文本片段數(shù)據(jù)和語音片段數(shù)據(jù)的關(guān)聯(lián)關(guān)系。
7.一種電子設(shè)備,包括第一處理器和存儲有程序指令的第一存儲器,其特征在于,所述第一處理器被配置為在執(zhí)行所述程序指令時,執(zhí)行如權(quán)利要求1或2所述的用于關(guān)聯(lián)語音數(shù)據(jù)的方法。
8.一種電子設(shè)備,包括第二處理器和存儲有程序指令的第二存儲器,其特征在于,所述第二處理器被配置為在執(zhí)行所述程序指令時,執(zhí)行如權(quán)利要求3或4所述的用于檢索語音數(shù)據(jù)的方法。
9.一種可讀存儲介質(zhì),存儲有可執(zhí)行指令,其特征在于,所述可執(zhí)行指令在運(yùn)行時執(zhí)行如權(quán)利要求1或2所述的用于關(guān)聯(lián)語音數(shù)據(jù)的方法。
10.一種可讀存儲介質(zhì),存儲有可執(zhí)行指令,其特征在于,所述可執(zhí)行指令在運(yùn)行時執(zhí)行如權(quán)利要求3或4所述的用于檢索語音數(shù)據(jù)的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海明略人工智能(集團(tuán))有限公司,未經(jīng)上海明略人工智能(集團(tuán))有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110539769.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 關(guān)聯(lián)裝置
- 數(shù)據(jù)關(guān)聯(lián)裝置和數(shù)據(jù)關(guān)聯(lián)方法
- 安全關(guān)聯(lián)
- 設(shè)備關(guān)聯(lián)
- 終端關(guān)聯(lián)裝置和終端關(guān)聯(lián)方法
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)分析方法和關(guān)聯(lián)分析系統(tǒng)
- 報文關(guān)聯(lián)方法、報文關(guān)聯(lián)裝置及報文關(guān)聯(lián)系統(tǒng)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





