[發明專利]文件存儲與查詢的方法及裝置、存儲介質在審
| 申請號: | 202010464465.8 | 申請日: | 2020-05-27 |
| 公開(公告)號: | CN111611208A | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 鄭金磊;劉華;周偉東;喻凌;劉凱 | 申請(專利權)人: | 北京太極華保科技股份有限公司 |
| 主分類號: | G06F16/14 | 分類號: | G06F16/14;G06F16/16;G06F16/172;G06F16/174;G10L13/08;G10L13/047 |
| 代理公司: | 北京善任知識產權代理有限公司 11650 | 代理人: | 張振偉 |
| 地址: | 102200 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文件 存儲 查詢 方法 裝置 介質 | ||
本發明提供一種文件存儲與查詢的方法及裝置、存儲介質,所述方法包括:獲取待進行語音合成的文本,對所述文本進行HASH值計算,得到所述文本的HASH值;以所計算的HASH值作為文件名,在設定的語音文件目錄下查詢是否存在相同文件名的語音文件;查詢到存在相同文件名的語音文件,調用所述相同文件名的語音文件,將所述相同文件名的語音文件作為所述文本的語音文件;未查詢到相同文件名的語音文件時,基于所述文本進行語音合成,以所計算的HASH值作為所合成的語音文件的文件名,將所合成的語音文件存儲在所述設定的語音文件目錄中。本發明由于通過了嚴格的文本壓縮算法,保證了文本精確去重,防止同樣的文本合成多次,節約了處理資源。
技術領域
本發明涉及智能語音處理中的文件存儲技術,尤其涉及一種文件存儲與查詢的方法及裝置、存儲介質。
背景技術
在智能語音技術中,存在一個必不可少的環節,就是文本轉語音(TTS,Text ToSpeech),語音合成時需要處理文本、文本轉拼音、拼音轉矩陣等一系列的消耗系統資源及耗時的過程,對于已經合成過的文本,希望通過緩存來查找語音。
對于緩存方案,就是要找到合成文本與合成語音文件的對應關系,這種對應關系可以在數據庫中保存,像關系型數據庫管理系統(MySQL,Structured Query Language)、postgresql這種關系型數據庫,通過表結構來反應對應關系,或者像redis、memcache這種非關系型數據庫存儲,通過鍵值對來反應對應關系,但是無論哪種對應關系的存儲方案,都需要以下幾個步驟:合成語音的生成、語音文件在文件系統的存儲、保存或設置文本及文件存儲路徑的對應關系、查詢文本及文件存儲路徑的對應關系是否存在、根據是否存在來合成語音或者返回存在的語音文件。這樣的方式從開發上,會和數據庫進行多次交互;從效率上講,需要借助于數據庫的插入和查詢,會有一定的耗時;從安全上講,數據庫中的數據一旦丟失,就會丟失所有的對應關系。
發明內容
有鑒于此,本發明的一個方式提供一種文件存儲與查詢的方法及裝置、存儲介質。
本發明一方面提供一種文件存儲與查詢的方法,包括:
獲取待進行語音合成的文本,對所述文本進行哈希HASH值計算,得到所述文本的HASH值;
以所計算的HASH值作為文件名,在設定的語音文件目錄下查詢是否存在相同文件名的語音文件;
查詢到存在相同文件名的語音文件,調用所述相同文件名的語音文件,將所述相同文件名的語音文件作為所述文本的語音文件;未查詢到相同文件名的語音文件時,基于所述文本進行語音合成,以所計算的HASH值作為所合成的語音文件的文件名,將所合成的語音文件存儲在所述設定的語音文件目錄中。
作為一種優選實現方式,所述方法還包括:
獲取所述文本的聲優、音量、語速、口音的信息至少之一,將所獲取的聲優、音量、語速、口音中的至少之一與所述文本拼接,形成拼接文本,對所述拼接文本進行哈希HASH值計算,得到所述拼接文本的HASH值。
以所計算的HASH值作為文件名,在設定的語音文件目錄下查詢是否存在相同文件名的語音文件;
查詢到存在相同文件名的語音文件,調用所述相同文件名的語音文件,將所述相同文件名的語音文件作為所述拼接文本的語音文件;未查詢到相同文件名的語音文件時,基于所述拼接文本進行語音合成,以所計算的HASH值作為所合成的語音文件的文件名,將所合成的語音文件存儲在所述設定的語音文件目錄中。
作為一種優選實現方式,所述方法還包括:
設定存儲語音文件的固定地址池,將所述固定地址池作為所述語音文件目錄;或者
獲取所述文本的HASH散列值,將所述HASH散列值中指定開始位置和結束位置對應的字符串作為語音文件目錄。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京太極華保科技股份有限公司,未經北京太極華保科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010464465.8/2.html,轉載請聲明來源鉆瓜專利網。





