[發(fā)明專利]文字標記方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì)有效

申請?zhí)枺?/td>	202011242256.5	申請日：	2020-11-09
公開（公告）號：	CN112201253B	公開（公告）日：	2023-08-25
發(fā)明（設(shè)計）人：	齊秀	申請（專利權(quán)）人：	觀華（廣州）電子科技有限公司
主分類號：	G10L15/26	分類號：	G10L15/26;G10L15/02;G10L15/16;G10L25/21;G10L25/87;G06F40/30;G06F40/289;G06N3/0442;G06N7/01
代理公司：	安徽盟友知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 34213	代理人：	鄧立忠
地址：	510000 廣東省廣州市南沙區(qū)豐澤東***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	文字標記方法裝置電子設(shè)備計算機可讀存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明涉及數(shù)據(jù)處理技術(shù)，揭露一種文字標記方法，包括：獲取原始語音數(shù)據(jù)集，對所述原始語音數(shù)據(jù)集進行靜音切除處理，得到初始語音數(shù)據(jù)集；對所述初始語音數(shù)據(jù)集進行特征提取，得到特征向量集；利用預先構(gòu)建的聲學模型、語言模型以及預設(shè)的字典對所述特征向量集進行語音識別轉(zhuǎn)換處理，得到文字集；根據(jù)預構(gòu)建的感情色彩庫對所述文字集進行標注，得到標識文字集。本發(fā)明還涉及區(qū)塊鏈技術(shù)，所述標識文字集可以存儲在區(qū)塊鏈節(jié)點中。本發(fā)明還揭露一種文字標記裝置、電子設(shè)備及存儲介質(zhì)。本發(fā)明可以解決傳統(tǒng)的會議記錄生成方法不能對會議記錄中的重點內(nèi)容進行標記的問題。

技術(shù)領(lǐng)域

本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域，尤其涉及一種文字標記方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì)。

背景技術(shù)

現(xiàn)有的會議記錄生成方法，通常是利用攝像機、麥克風、錄音筆等設(shè)備對會議過程中各與會人員的發(fā)言進行錄音及錄像，會后做會議記錄的人員可以通過查看、回放錄音及錄像進行整理，以生成會議記錄。這種方法十分繁瑣，浪費人力物力且效率較低。

此外，傳統(tǒng)的會議記錄生成方法并不能對會議記錄中的重點內(nèi)容進行標記，一般是需要人工將會議中的談話內(nèi)容進行記錄且根據(jù)記錄內(nèi)容中的溝通點進行篩選。

發(fā)明內(nèi)容

本發(fā)明提供一種文字標記方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì)，其主要目的在于解決傳統(tǒng)的會議記錄生成方法不能對會議記錄中的重點內(nèi)容進行標記的問題。

為實現(xiàn)上述目的，本發(fā)明提供的一種文字標記方法，包括：

獲取原始語音數(shù)據(jù)集，對所述原始語音數(shù)據(jù)集進行靜音切除處理，得到初始語音數(shù)據(jù)集；

對所述初始語音數(shù)據(jù)集進行特征提取，得到特征向量集；

利用預先構(gòu)建的聲學模型、語言模型以及預設(shè)的字典對所述特征向量集進行語音識別轉(zhuǎn)換處理，得到文字集；

根據(jù)預構(gòu)建的感情色彩庫對所述文字集進行標注，得到標識文字集。

可選地，所述對所述初始語音數(shù)據(jù)集進行特征提取，得到特征向量集，包括：

對所述初始語音數(shù)據(jù)集進行預加重處理、分幀處理、加窗處理以及快速傅里葉變換，得到所述初始語音數(shù)據(jù)集的頻譜；

對所述頻譜取模平方，得到所述初始語音數(shù)據(jù)集的功率譜；

利用一組預設(shè)的梅爾尺度的三角形濾波器組對所述功率譜進行計算并得到對數(shù)能量，對所述對數(shù)能量進行離散余弦變換，得到特征向量集。

可選地，所述分幀處理包括：

根據(jù)預設(shè)的采樣點N對所述原始語音數(shù)據(jù)集進行分幀，得到分幀集；

根據(jù)預設(shè)的取樣點M從所述分幀集獲取多個幀，并將所述多個幀進行重疊，得到分幀語音數(shù)據(jù)集。

可選地，所述快速傅里葉變換包括：

及

所述對所述頻譜取模平方包括：

其中，s(k)為頻譜，p(k)為功率譜，S′(n)為加窗信號，N為幀的大小，n為幀的個數(shù)，k為頻譜上的預設(shè)參數(shù)。

可選地，所述利用預先構(gòu)建的聲學模型、語言模型以及預設(shè)的字典對所述特征向量集進行語音識別轉(zhuǎn)換處理，得到文字集，包括：

利用所述聲學模型對所述特征向量集進行音素處理，得到音素信息；

根據(jù)預設(shè)的字典，獲取與所述音素信息相對應(yīng)的單個字或者詞；

利用所述語言模型識別所述單個字或者詞相互關(guān)聯(lián)的概率值，根據(jù)所述概率值將所述單個字或者詞識別成完整的文字集。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于觀華（廣州）電子科技有限公司，未經(jīng)觀華（廣州）電子科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011242256.5/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種保濕美白面膜及其制備方法
下一篇：一種柔順洗發(fā)水及其制備方法

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準模板；訓練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】