[發(fā)明專利]語(yǔ)音采集方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201810550137.2 | 申請(qǐng)日: | 2018-05-31 |
| 公開(kāi)(公告)號(hào): | CN108831476A | 公開(kāi)(公告)日: | 2018-11-16 |
| 發(fā)明(設(shè)計(jì))人: | 黃錦倫 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G10L15/26 | 分類號(hào): | G10L15/26;G10L15/22;H04L12/58;G06F17/30 |
| 代理公司: | 深圳眾鼎專利商標(biāo)代理事務(wù)所(普通合伙) 44325 | 代理人: | 譚果林 |
| 地址: | 518000 廣東省深*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 通訊應(yīng)用 應(yīng)用賬號(hào) 錄音文件 語(yǔ)料 身份標(biāo)識(shí)信息 計(jì)算機(jī)設(shè)備 文本相似度 存儲(chǔ)介質(zhì) 目標(biāo)文本 語(yǔ)音采集 語(yǔ)音數(shù)據(jù) 調(diào)用 語(yǔ)音識(shí)別功能 獲取請(qǐng)求 開(kāi)始錄音 快速采集 錄音功能 文本匹配 映射關(guān)系 相似度 離線 算法 預(yù)設(shè) 匹配 數(shù)據(jù)庫(kù) 錄音 采集 發(fā)送 轉(zhuǎn)化 | ||
本發(fā)明公開(kāi)了一種語(yǔ)音采集方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),所述方法包括:在接收到用戶通過(guò)通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)發(fā)送的語(yǔ)料獲取請(qǐng)求時(shí),選取對(duì)應(yīng)的初始語(yǔ)料,并獲取用戶的身份標(biāo)識(shí)信息,在接收到開(kāi)始錄音的請(qǐng)求后,調(diào)用通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)的錄音功能進(jìn)行錄音,得到錄音文件,并調(diào)用通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)的離線語(yǔ)音識(shí)別功能,將該錄音文件轉(zhuǎn)化為目標(biāo)文本,使用文本匹配算法,將該目標(biāo)文本與初始語(yǔ)料進(jìn)行匹配,得到文本相似度,若該文本相似度大于或等于預(yù)設(shè)的相似度閾值,則將錄音文件、身份標(biāo)識(shí)信息和它們之間的映射關(guān)系存入到數(shù)據(jù)庫(kù),從而實(shí)現(xiàn)了使用通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行快速采集,提高了語(yǔ)音數(shù)據(jù)的采集效率。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音采集方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著科技的進(jìn)步和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,聲紋識(shí)別技術(shù)和語(yǔ)音識(shí)別技術(shù)越來(lái)越受人們的青睞,其中聲紋識(shí)別技術(shù)用于方便快捷地確定說(shuō)話人身份,語(yǔ)音識(shí)別技術(shù)用于在將自然語(yǔ)音進(jìn)行識(shí)別轉(zhuǎn)化成文字,聲紋識(shí)別技術(shù)和語(yǔ)音識(shí)別技術(shù)都需要采集大量的說(shuō)話人信息和說(shuō)話人對(duì)應(yīng)的語(yǔ)音信息,用來(lái)進(jìn)行模型的訓(xùn)練。
當(dāng)前,語(yǔ)音采集主要通過(guò)使用專業(yè)錄音設(shè)備進(jìn)行語(yǔ)音錄取,得到錄音文件,然后人工標(biāo)記錄音文件對(duì)應(yīng)的說(shuō)話人,這種人工方式不能及時(shí)清除掉不合格的錄音,且操作麻煩,使得采集效率低,同時(shí),這種人工采集方式不適用于對(duì)距離較遠(yuǎn)的人員進(jìn)行語(yǔ)音采集,若需要對(duì)不同地區(qū)的人員同時(shí)進(jìn)行語(yǔ)音采集,只能通過(guò)購(gòu)置多臺(tái)錄音設(shè)備,浪費(fèi)了大量采集成本。
發(fā)明內(nèi)容
基于此,有必要針對(duì)上述技術(shù)問(wèn)題,提供一種基于通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)提高語(yǔ)音采集效率和節(jié)約采集成本的語(yǔ)音采集方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
一種語(yǔ)音采集方法,包括:
若接收到用戶通過(guò)通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)發(fā)送的語(yǔ)料獲取請(qǐng)求,則獲取所述語(yǔ)料獲取請(qǐng)求中包含的基礎(chǔ)語(yǔ)料和所述用戶的身份標(biāo)識(shí)信息;
從所述基礎(chǔ)語(yǔ)料對(duì)應(yīng)的基礎(chǔ)語(yǔ)料庫(kù)中隨機(jī)選取一條語(yǔ)料,作為初始語(yǔ)料,并顯示在所述通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)的界面上;
若接收到所述用戶通過(guò)所述通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)發(fā)送的開(kāi)始錄音請(qǐng)求,則使用預(yù)設(shè)的錄音調(diào)用框架,調(diào)用所述通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)的錄音功能進(jìn)行錄音并生成錄音文件;
若接收到所述用戶通過(guò)所述通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)發(fā)送的終止錄音請(qǐng)求,則使用預(yù)設(shè)的語(yǔ)音識(shí)別調(diào)用框架,調(diào)用所述通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)的離線語(yǔ)音識(shí)別功能將所述錄音文件轉(zhuǎn)化為目標(biāo)文本;
對(duì)所述目標(biāo)文本與所述初始語(yǔ)料進(jìn)行文本相似度匹配,得到所述目標(biāo)文本與所述初始語(yǔ)料之間的文本相似度;
若所述文本相似度大于或等于預(yù)設(shè)相似度閾值,則建立所述錄音文件與所述身份標(biāo)識(shí)信息之間的映射關(guān)系,并對(duì)應(yīng)保存所述錄音文件、所述身份標(biāo)識(shí)信息和所述映射關(guān)系。
一種語(yǔ)音采集裝置,包括:
領(lǐng)域確定模塊,用于若接收到用戶通過(guò)通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)發(fā)送的語(yǔ)料獲取請(qǐng)求,則獲取所述語(yǔ)料獲取請(qǐng)求中包含的基礎(chǔ)語(yǔ)料和所述用戶的身份標(biāo)識(shí)信息;
語(yǔ)料選取模塊,用于從所述基礎(chǔ)語(yǔ)料對(duì)應(yīng)的基礎(chǔ)語(yǔ)料庫(kù)中隨機(jī)選取一條語(yǔ)料,作為初始語(yǔ)料,并顯示在所述通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)的界面上;
錄音生成模塊,用于若接收到所述用戶通過(guò)所述通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)發(fā)送的開(kāi)始錄音請(qǐng)求,則使用預(yù)設(shè)的錄音調(diào)用框架,調(diào)用所述通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)的錄音功能進(jìn)行錄音并生成錄音文件;
語(yǔ)音識(shí)別模塊,用于若接收到所述用戶通過(guò)所述通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)發(fā)送的終止錄音請(qǐng)求,則使用預(yù)設(shè)的語(yǔ)音識(shí)別調(diào)用框架,調(diào)用所述通訊應(yīng)用平臺(tái)的應(yīng)用賬號(hào)的離線語(yǔ)音識(shí)別功能將所述錄音文件轉(zhuǎn)化為目標(biāo)文本;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810550137.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 分布式個(gè)人移動(dòng)終端系統(tǒng)
- 移動(dòng)通訊裝置啟動(dòng)驅(qū)動(dòng)程序的方法
- 一種終端及其即時(shí)通訊應(yīng)用的管理方法及系統(tǒng)
- 基于聯(lián)系人啟動(dòng)通訊應(yīng)用的方法及移動(dòng)終端
- 一種即時(shí)通訊應(yīng)用中的消息同步方法及裝置
- 集成即時(shí)通訊/社交應(yīng)用的車載娛樂(lè)系統(tǒng)及方法
- 手機(jī)短信應(yīng)用融合第三方通訊應(yīng)用的通訊方法及裝置
- 一種Web通訊應(yīng)用的通訊監(jiān)控方法和裝置
- 移動(dòng)終端快速啟動(dòng)方法和裝置
- 一種適用于多種機(jī)器的通訊板系統(tǒng)及工作方法
- 一種語(yǔ)料提取器及提取語(yǔ)料的方法
- 軍事信息語(yǔ)料庫(kù)構(gòu)建方法及系統(tǒng)
- 待標(biāo)注語(yǔ)料的分配方法、裝置、可讀存儲(chǔ)介質(zhì)及電子設(shè)備
- 語(yǔ)料泛化方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 語(yǔ)料數(shù)據(jù)的處理方法、裝置、計(jì)算機(jī)可讀介質(zhì)及電子設(shè)備
- 一種擴(kuò)展語(yǔ)料挖掘方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 語(yǔ)料生成方法、語(yǔ)料生成裝置、和存儲(chǔ)介質(zhì)
- 短語(yǔ)語(yǔ)料獲取方法及短語(yǔ)語(yǔ)料獲取裝置
- 一種語(yǔ)料分類方法、裝置及服務(wù)器
- 一種輸入方法、裝置和電子設(shè)備





