[發(fā)明專利]一種聲音檢索方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201910124135.1 | 申請(qǐng)日: | 2019-02-19 |
| 公開(公告)號(hào): | CN109920409B | 公開(公告)日: | 2021-07-09 |
| 發(fā)明(設(shè)計(jì))人: | 李秀林;李舒揚(yáng) | 申請(qǐng)(專利權(quán))人: | 標(biāo)貝(深圳)科技有限公司 |
| 主分類號(hào): | G10L15/08 | 分類號(hào): | G10L15/08;G10L13/08;G06F16/61;G06F16/635 |
| 代理公司: | 北京睿邦知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11481 | 代理人: | 徐丁峰;張瑋 |
| 地址: | 518000 廣東省深圳市福田區(qū)福田街*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 聲音 檢索 方法 裝置 系統(tǒng) 存儲(chǔ) 介質(zhì) | ||
本發(fā)明提供了一種聲音檢索方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)。該方法包括:接收需要檢索的聲音條目的描述特征;根據(jù)所述描述特征確定關(guān)鍵字集合;將所述關(guān)鍵字集合與聲音數(shù)據(jù)庫中的各個(gè)聲音條目的聲音標(biāo)簽分別進(jìn)行匹配;根據(jù)匹配度對(duì)所述各個(gè)聲音條目進(jìn)行排序,并將匹配度最高的N個(gè)聲音條目作為檢索結(jié)果,其中,N為正整數(shù)。上述技術(shù)方案根據(jù)對(duì)聲音的描述從聲音數(shù)據(jù)庫中檢索相匹配的聲音條目,獲取滿足不同需求的聲音數(shù)據(jù)。從而實(shí)現(xiàn)了一種友好的聲音檢索方法,使得根據(jù)需求進(jìn)行對(duì)應(yīng)聲音的選擇變得更加便捷、快速,同時(shí)也極大提升了聲音數(shù)據(jù)的實(shí)用性,使得豐富的音源可以按需索引獲取。
技術(shù)領(lǐng)域
本發(fā)明涉及聲音數(shù)據(jù)處理領(lǐng)域,更具體地涉及一種聲音檢索方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著科技的發(fā)展,語音數(shù)據(jù)處理越來越多地應(yīng)用于各種應(yīng)用領(lǐng)域。但目前的語音數(shù)據(jù)處理通常僅涉及少數(shù)幾種聲音,不能滿足用戶的多種需求。
例如,語音合成技術(shù)是將文本轉(zhuǎn)換成語音的技術(shù)。通過讓機(jī)器發(fā)聲可以實(shí)現(xiàn)人機(jī)交互。對(duì)于語音合成系統(tǒng),可以預(yù)先對(duì)一個(gè)特定發(fā)音人的聲音進(jìn)行模型訓(xùn)練。利用訓(xùn)練好的模型和音庫等數(shù)據(jù),可以通過語音合成系統(tǒng)實(shí)現(xiàn)語音合成。
隨著物聯(lián)網(wǎng)及人工智能技術(shù)的發(fā)展,越來越多的設(shè)備有了語音交互的需求。為了讓不同設(shè)備或者產(chǎn)品具有自己的人設(shè)特點(diǎn),往往需要采用不同特色的聲音進(jìn)行信息表達(dá)。
目前大部分語音合成解決方案都只能提供少數(shù)幾個(gè)聲音,未能提供豐富的聲音供用戶進(jìn)行挑選來實(shí)現(xiàn)更好的與產(chǎn)品角色匹配的聲音效果。即便有了豐富的聲音數(shù)據(jù)可供選擇,由于聲音無法用類似圖片的方式進(jìn)行展示,用戶也難以基于自己的各種需求進(jìn)行快速有效的選擇。
因此,亟需一種新的聲音檢索技術(shù),以解決上述問題。
發(fā)明內(nèi)容
考慮到上述問題而提出了本發(fā)明。本發(fā)明提供了一種聲音檢索方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)。
根據(jù)本發(fā)明一方面,提供了一種聲音檢索方法,包括:
接收需要檢索的聲音條目的描述特征;
根據(jù)所述描述特征確定關(guān)鍵字集合;
將所述關(guān)鍵字集合與聲音數(shù)據(jù)庫中的各個(gè)聲音條目的聲音標(biāo)簽分別進(jìn)行匹配;
根據(jù)匹配度對(duì)所述各個(gè)聲音條目進(jìn)行排序,并將匹配度最高的N個(gè)聲音條目作為檢索結(jié)果,其中,N為正整數(shù)。
示例性地,所述根據(jù)所述描述特征確定關(guān)鍵字集合包括:
將所述描述特征作為關(guān)鍵字元素加入所述關(guān)鍵字集合;
針對(duì)所述描述特征中的每個(gè)描述特征,以該描述特征為知識(shí)點(diǎn)對(duì)聲音標(biāo)簽知識(shí)庫進(jìn)行檢索,以獲取與該聲音特征相關(guān)聯(lián)的知識(shí)點(diǎn)作為擴(kuò)展特征,并把所述擴(kuò)展特征也作為關(guān)鍵字元素加入所述關(guān)鍵字集合。
示例性地,所述接收需要檢索的聲音條目的描述特征包括:
接收用戶對(duì)需要檢索的聲音條目的描述語句;
利用自然語言處理技術(shù)從所述描述語句中提取所述描述特征。
示例性地,所述接收用戶對(duì)需要檢索的聲音條目的描述語句包括:
接收用戶通過文本方式或語音方式輸入的描述語句。
示例性地,所述接收需要檢索的聲音條目的描述特征包括:
接收用戶通過圖形交互界面方式選擇的描述特征。
示例性地,所述將所述關(guān)鍵字集合與聲音數(shù)據(jù)庫中的各個(gè)聲音條目的聲音標(biāo)簽分別進(jìn)行匹配包括:
通過余弦相似度匹配算法、詞向量距離匹配算法或神經(jīng)網(wǎng)絡(luò)匹配算法,將所述關(guān)鍵字集合分別與所述聲音數(shù)據(jù)庫中的各個(gè)聲音條目的聲音標(biāo)簽進(jìn)行匹配。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于標(biāo)貝(深圳)科技有限公司,未經(jīng)標(biāo)貝(深圳)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910124135.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





