[發(fā)明專利]一種音頻信息提取方法、終端及計算機(jī)可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010094370.1 | 申請日: | 2020-02-15 |
| 公開(公告)號: | CN111415651A | 公開(公告)日: | 2020-07-14 |
| 發(fā)明(設(shè)計)人: | 張文海 | 申請(專利權(quán))人: | 深圳傳音控股股份有限公司 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L17/00;G10L25/51 |
| 代理公司: | 深圳市嘉勤知識產(chǎn)權(quán)代理有限公司 44651 | 代理人: | 何龍其 |
| 地址: | 518000 廣東省深圳市南山區(qū)粵海街道深南大道97*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 信息 提取 方法 終端 計算機(jī) 可讀 存儲 介質(zhì) | ||
本發(fā)明公開了一種音頻信息提取方法、終端及計算機(jī)可讀存儲介質(zhì),該方法包括:確定待提取的音頻,基于音頻確定音頻的音軌,其中音頻至少具有兩個音軌,解析音頻得到各音軌產(chǎn)生的音頻文本,基于各音軌對音頻中的各音頻文本進(jìn)行存儲,以作為提取得到的音頻信息。由于可以直接通過計算機(jī)解析獲取得到音頻中各個音軌產(chǎn)生的音頻文本,基于各音軌對音頻中的各音頻文本進(jìn)行存儲可得到從音頻中提取得到的音頻信息,即基于本發(fā)明提供的技術(shù)方案可以不需要用戶人工的通過播放聽取的方式獲取音頻中音頻信息,便于用戶進(jìn)行查閱,使得用戶獲得較高的體驗(yàn)。
技術(shù)領(lǐng)域
本發(fā)明涉及信息技術(shù)領(lǐng)域,更具體地說,涉及一種音頻信息提取方法、終端及計算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
現(xiàn)在的智能終端可以通過多樣化的錄音軟件產(chǎn)生音頻,這些音頻更多的是以WAV格式、MIDI格式、CDA格式和MP3格式等的聲音格式進(jìn)行存儲,當(dāng)用戶想要獲取音頻中的信息時,需要重新將音頻聽一遍甚至多遍,對于用戶而言這將十分耗時,這將降低用戶體驗(yàn)感。
發(fā)明內(nèi)容
本發(fā)明新提供了一種音頻信息提取方法、終端及計算機(jī)可讀存儲介質(zhì),解決現(xiàn)有技術(shù)中需要通過播放聽取的方式獲取音頻中音頻信息而降低用戶體驗(yàn)的技術(shù)問題。
本發(fā)明提供一種音頻信息提取方法,該音頻信息提取方法包括:
確定待提取的音頻,基于音頻確定音頻的音軌,其中音頻至少具有兩個音軌;
解析音頻得到各音軌產(chǎn)生的音頻文本;
基于各音軌對音頻中的各音頻文本進(jìn)行存儲,以作為提取得到的音頻信息。
可選的,基于音頻確定音頻的音軌包括:
解析音頻得到音頻的聲紋特征,音頻包括至少兩個聲波,且音頻至少具有兩個聲紋特征;
將音頻中具有相同聲紋特征的聲波判斷屬于同一音軌,得到音頻中的各個音軌。
可選的,基于音頻確定音頻的音軌包括:
根據(jù)音頻確定音頻的聲源,音頻包括至少兩個聲波,且音頻至少具有兩個聲源;
將音頻中具有相同聲源的聲波判斷屬于同一音軌,得到音頻中的各個音軌。
可選的,根據(jù)音頻確定音頻的聲源包括:
確定產(chǎn)生音頻的社交應(yīng)用;
查找社交應(yīng)用中參與產(chǎn)生音頻的各聯(lián)系人,將各聯(lián)系人確定為音頻的聲源。
可選的,基于各音軌對音頻中的各音頻文本進(jìn)行存儲之后,音頻信息提取方法還包括:
獲取待提取的字符;
確定字符與各音頻文本的時間順序;
按照時間順序在各音頻文本間添加字符。
可選的,解析音頻得到各音軌產(chǎn)生的音頻文本之后,音頻信息提取方法還包括:
顯示音軌選擇框,音軌選擇框中包括音頻的音軌以及音軌產(chǎn)生的音頻文本;
檢測對音軌選擇框中音軌的選擇操作,修改被選擇音軌所產(chǎn)生的音頻文本。
可選的,基于各音軌對音頻中的各音頻文本進(jìn)行存儲,包括:
確定音頻的存儲語言以及音頻中異于存儲語言的音頻文本;
將音頻中異于存儲語言的音頻文本翻譯為存儲語言,得到音頻統(tǒng)一語言后的各音頻文本;
確定音頻中各音頻文本的時間順序,按照時間順序存儲利用各音軌所標(biāo)識的各音頻文本。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳傳音控股股份有限公司,未經(jīng)深圳傳音控股股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010094370.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





