[發(fā)明專利]語音數據句類識別方法和裝置及系統有效
申請?zhí)枺?/td> | 201611185200.4 | 申請日: | 2016-12-20 |
公開(公告)號: | CN106710588B | 公開(公告)日: | 2020-06-02 |
發(fā)明(設計)人: | 李莉;司華建;李寶善 | 申請(專利權)人: | 科大訊飛股份有限公司 |
主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/18;G10L15/30;G10L25/21 |
代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 語音 數據 識別 方法 裝置 系統 | ||
1.一種語音數據句類識別方法,其特征在于,包括:
接收待識別的語音數據,所述待識別的語音數據以句為單位;
獲取所述語音數據的句類識別特征,所述句類識別特征包括聲學句類識別特征,或者,所述句類識別特征包括聲學句類識別特征和語義句類識別特征;
根據預先構建的句類識別模型和所述句類識別特征,識別所述語音數據的句類,所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到,所述語音數據的句類包括每句語音數據的句類,所述每句語音數據的句類是指按照所述每句語音數據中句子的語氣劃分的類型。
2.根據權利要求1所述的方法,其特征在于,還包括:構建句類識別模型,所述構建句類識別模型包括:
獲取語音數據樣本;
確定所述語音數據樣本的句類;
獲取所述語音數據樣本的句類識別特征;
根據所述語音數據樣本的句類識別特征和所述語音數據樣本的句類,進行模型訓練,構建得到句類識別模型。
3.根據權利要求1所述的方法,其特征在于,獲取所述語音數據的聲學句類識別特征,包括:
對所述語音數據進行劃分,得到所述語音數據包含的多個語音片段;
計算所述語音片段的短時平均能量;
根據所述短時平均能量確定所述語音數據的聲學句類識別特征。
4.根據權利要求3所述的方法,其特征在于,所述根據所述短時平均能量確定聲學句類識別特征,包括:
將所有所述短時平均能量組成的向量,確定為所述語音數據的聲學句類識別特征;或者,
在所有所述短時平均能量中確定出最大短時平均能量,將所述最大短時平均能量確定為所述語音數據的聲學句類識別特征;或者,
將所有所述短時平均能量和最大短時平均能量組成的向量,確定為所述語音數據的聲學句類識別特征。
5.根據權利要求1所述的方法,其特征在于,獲取所述語音數據的語義句類識別特征,包括:
對所述語音數據進行劃分,得到所述語音數據包含的多個語音片段,以及,從所述多個語音片段中獲取短時平均能量最大的語音片段;
根據所述短時平均能量最大的語音片段,獲取擴展后的語音片段對應的文本數據;
根據所述文本數據確定所述語音數據的語義句類識別特征。
6.根據權利要求5所述的方法,其特征在于,所述語義句類識別特征包括如下項的至少一項:
句互信息向量,所述句互信息向量為所述文本數據包含的詞語對應的互信息向量的加權和,所述互信息向量為所述詞語與每種句類之間的互信息組成的向量;
句子向量,所述句子向量為所述文本數據包含的詞語對應的詞向量的加權和。
7.根據權利要求3或5所述的方法,其特征在于,所述對所述語音數據進行劃分,得到所述語音數據包含的多個語音片段,包括:
對所述語音數據進行語音識別,得到對應的整句文本數據;將所述整句文本數據劃分為多個文本片段,并根據所述文本片段對所述語音數據進行劃分,得到多個語音片段。
8.根據權利要求7所述的方法,其特征在于,所述根據所述短時平均能量最大的語音片段,獲取擴展后的語音片段對應的文本數據,包括:
對所述整句文本數據進行分詞,得到分詞結果;
在所述整句文本數據中提取出所述短時平均能量最大的語音片段對應的文本數據,并確定所述提取出的文本數據包含的起始詞語的位置和結束詞語的位置;
確定擴展窗的窗口大小;
根據所述提取出的文本數據包含的起始詞語的位置和結束詞語的位置,以及所述窗口大小,確定擴展后語音片段對應的文本數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611185200.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種非開挖涉水管道內壁修復材料及其制備方法
- 下一篇:圖片推薦方法和裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發(fā)送方法、數據發(fā)送系統、數據發(fā)送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發(fā)送和數據接收設備、數據發(fā)送和數據接收方法
- 數據發(fā)送裝置、數據接收裝置、數據收發(fā)系統、數據發(fā)送方法、數據接收方法和數據收發(fā)方法
- 數據發(fā)送方法、數據再現方法、數據發(fā)送裝置及數據再現裝置
- 數據發(fā)送方法、數據再現方法、數據發(fā)送裝置及數據再現裝置