[發(fā)明專(zhuān)利]一種語(yǔ)音數(shù)據(jù)與文本數(shù)據(jù)的映射管理方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910586614.5 | 申請(qǐng)日: | 2019-07-01 |
| 公開(kāi)(公告)號(hào): | CN110275979A | 公開(kāi)(公告)日: | 2019-09-24 |
| 發(fā)明(設(shè)計(jì))人: | 游萌;何云鵬;高君效;許兵 | 申請(qǐng)(專(zhuān)利權(quán))人: | 成都啟英泰倫科技有限公司 |
| 主分類(lèi)號(hào): | G06F16/61 | 分類(lèi)號(hào): | G06F16/61;G06F16/68 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 610041 四川省成都市高新區(qū)*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本數(shù)據(jù) 語(yǔ)音數(shù)據(jù) 映射 索引 存儲(chǔ)空間 管理關(guān)系 海量數(shù)據(jù) 建立索引 音頻數(shù)據(jù) 批量化 索引庫(kù) 多層 分層 調(diào)用 管理 刪除 搜索 文本 | ||
一種語(yǔ)音數(shù)據(jù)與文本數(shù)據(jù)的映射管理方法,對(duì)于語(yǔ)音數(shù)據(jù)的命名中,包含多個(gè)參數(shù)Ci,每一語(yǔ)音數(shù)據(jù)命名對(duì)應(yīng)唯一文本數(shù)據(jù),所述文本數(shù)據(jù)為語(yǔ)音數(shù)據(jù)的對(duì)應(yīng)文本;對(duì)于命名建立如下索引:以文本數(shù)據(jù)為依據(jù),建立每一文本數(shù)據(jù)下對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)命名索引庫(kù);對(duì)每一語(yǔ)音數(shù)據(jù)的命名建立索引庫(kù),依次以每一參數(shù)為索引,分層建立多層索引。采用本發(fā)明所述的語(yǔ)音數(shù)據(jù)與文本數(shù)據(jù)的映射管理方法,可以對(duì)音頻數(shù)據(jù)和文本數(shù)據(jù)實(shí)現(xiàn)一一對(duì)應(yīng)的映射管理關(guān)系,并有效降低了文件命名和進(jìn)行數(shù)據(jù)管理所需要的存儲(chǔ)空間大小,數(shù)據(jù)的搜索和調(diào)用更加快速,同時(shí),對(duì)海量數(shù)據(jù)的批量化新增、修改和刪除也更加方便快捷。
技術(shù)領(lǐng)域
本發(fā)明屬于人工智能技術(shù)領(lǐng)域,涉及一種語(yǔ)音數(shù)據(jù)管理方法,具體涉及一種語(yǔ)音數(shù)據(jù)與文本數(shù)據(jù)的映射管理方法。
背景技術(shù)
語(yǔ)音數(shù)據(jù)的識(shí)別依賴(lài)于人工智能神經(jīng)網(wǎng)絡(luò)的反復(fù)持續(xù)訓(xùn)練,需要海量的語(yǔ)音數(shù)據(jù),語(yǔ)音數(shù)據(jù)通常根據(jù)不同發(fā)音者,發(fā)音時(shí)間,采集距離等進(jìn)行分類(lèi),一般來(lái)說(shuō)訓(xùn)練用數(shù)據(jù)的多寡和數(shù)據(jù)標(biāo)注的質(zhì)量以及整體的數(shù)據(jù)管理體系是當(dāng)下人工智能為主體業(yè)務(wù)的公司運(yùn)營(yíng)管理方面的重中之重,而目前對(duì)于海量語(yǔ)音數(shù)據(jù)的管理在行業(yè)內(nèi)并沒(méi)有統(tǒng)一的管理流程和規(guī)范。主要用于大數(shù)據(jù)音頻文件的檢索和文本的一一對(duì)應(yīng)關(guān)系的文件管理。
在確立一對(duì)一的數(shù)據(jù)結(jié)構(gòu)的關(guān)系上,通常的結(jié)構(gòu)是一個(gè)音頻文件對(duì)應(yīng)于一個(gè)文本的標(biāo)注,而隨著技術(shù)的發(fā)展和訓(xùn)練的需求,一對(duì)一并非全部數(shù)據(jù)類(lèi)型的格式。數(shù)據(jù)在采樣的過(guò)程中可能存在多個(gè)距離,或多個(gè)發(fā)音志愿者對(duì)應(yīng)于同一組朗讀數(shù)據(jù)的情況。一般的語(yǔ)音數(shù)據(jù)在現(xiàn)場(chǎng)采集的過(guò)程中數(shù)據(jù)的保存是依據(jù)發(fā)音者,距離信息,采樣類(lèi)型及采樣設(shè)備等明顯標(biāo)志,但是在收集數(shù)據(jù)后的整理階段,通常會(huì)對(duì)海量數(shù)據(jù)進(jìn)行甄別和篩選,選取其中的關(guān)鍵信息保存并且規(guī)則化數(shù)據(jù)的結(jié)構(gòu),而對(duì)于這些數(shù)據(jù)關(guān)鍵信息的管理需要充分考慮存儲(chǔ)架構(gòu)在空間上的復(fù)雜度,因?yàn)榇髷?shù)據(jù)領(lǐng)域空間存儲(chǔ)的大小,處理相同的數(shù)據(jù)使用的存儲(chǔ)空間越大,維護(hù)成本越高,訪問(wèn)數(shù)據(jù)調(diào)度時(shí)間也越長(zhǎng),造成數(shù)據(jù)成本的單位存儲(chǔ)介質(zhì)綜合價(jià)格也越高昂。
發(fā)明內(nèi)容
為克服現(xiàn)有技術(shù)存在的技術(shù)缺陷,本發(fā)明公開(kāi)了一種語(yǔ)音數(shù)據(jù)與文本數(shù)據(jù)的映射管理方法。
本發(fā)明所述一種語(yǔ)音數(shù)據(jù)與文本數(shù)據(jù)的映射管理方法,
對(duì)于語(yǔ)音數(shù)據(jù)的命名中,包含多個(gè)參數(shù)Ci,每一語(yǔ)音數(shù)據(jù)命名對(duì)應(yīng)唯一文本數(shù)據(jù),所述文本數(shù)據(jù)為語(yǔ)音數(shù)據(jù)的對(duì)應(yīng)文本;
對(duì)于命名建立如下索引:
以文本數(shù)據(jù)為依據(jù),建立每一文本數(shù)據(jù)下對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)命名索引庫(kù);
對(duì)每一語(yǔ)音數(shù)據(jù)的命名建立索引庫(kù),依次以每一參數(shù)為索引,分層建立多層索引。
優(yōu)選的,所述參數(shù)Ci中至少一個(gè)參數(shù)Ck,其關(guān)聯(lián)有唯一的其他參數(shù),則語(yǔ)音數(shù)據(jù)命名中省略關(guān)聯(lián)的其他參數(shù),
對(duì)于未關(guān)聯(lián)參數(shù),以其關(guān)聯(lián)的每一參數(shù)為索引,分層建立對(duì)文本數(shù)據(jù)的多層索引;
對(duì)于被關(guān)聯(lián)的參數(shù),以其關(guān)聯(lián)的每一參數(shù)為索引,分層建議對(duì)參數(shù)Ck的多層索引。
優(yōu)選的,所述管理方法包括對(duì)數(shù)據(jù)的增加、修改和刪除。
進(jìn)一步的,所述數(shù)據(jù)的修改和刪除是對(duì)應(yīng)參數(shù)索引的修改和刪除。
采用本發(fā)明所述的語(yǔ)音數(shù)據(jù)與文本數(shù)據(jù)的映射管理方法,可以對(duì)音頻數(shù)據(jù)和文本數(shù)據(jù)實(shí)現(xiàn)一一對(duì)應(yīng)的映射管理關(guān)系,并有效降低了文件命名和進(jìn)行數(shù)據(jù)管理所需要的存儲(chǔ)空間大小,數(shù)據(jù)的搜索和調(diào)用更加快速,同時(shí),對(duì)海量數(shù)據(jù)的批量化新增、修改和刪除也更加方便快捷。
附圖說(shuō)明
圖1給出利用本發(fā)明進(jìn)行數(shù)據(jù)檢索管理的一種具體實(shí)施方式流程圖。
具體實(shí)施方式
下面對(duì)本發(fā)明的具體實(shí)施方式作進(jìn)一步的詳細(xì)說(shuō)明。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于成都啟英泰倫科技有限公司,未經(jīng)成都啟英泰倫科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910586614.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種韻律預(yù)測(cè)方法及系統(tǒng)
- 一種基于KNN技術(shù)的語(yǔ)料庫(kù)文本分類(lèi)方法
- 文本數(shù)據(jù)標(biāo)注方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 數(shù)據(jù)采集方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本的處理、文本分類(lèi)模型的訓(xùn)練方法及裝置
- 文本加密方法及裝置、終端設(shè)備、存儲(chǔ)介質(zhì)
- 文本數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 富文本數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 文本分類(lèi)模型構(gòu)建、文本分類(lèi)方法及裝置
- 文本匹配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 導(dǎo)航系統(tǒng)
- 一種語(yǔ)音檢測(cè)方法和系統(tǒng)
- 語(yǔ)音數(shù)據(jù)庫(kù)創(chuàng)建方法、聲紋注冊(cè)方法、裝置、設(shè)備及介質(zhì)
- 即時(shí)聊天中語(yǔ)音數(shù)據(jù)的摘要生成方法、服務(wù)器及系統(tǒng)
- 一種語(yǔ)音智能識(shí)別設(shè)備及語(yǔ)音智能識(shí)別方法
- 語(yǔ)音數(shù)據(jù)的獲取方法和系統(tǒng)
- 一種語(yǔ)音數(shù)據(jù)處理方法及裝置
- 語(yǔ)音數(shù)據(jù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種語(yǔ)音數(shù)據(jù)主題識(shí)別的方法及裝置
- 語(yǔ)音喚醒方法、裝置、系統(tǒng)、設(shè)備和存儲(chǔ)介質(zhì)





