[發明專利]一種語音處理方法和裝置有效
| 申請號: | 201610211171.8 | 申請日: | 2016-04-06 |
| 公開(公告)號: | CN107293285B | 公開(公告)日: | 2020-10-13 |
| 發明(設計)人: | 康洪;傅華;曾侃;溫建軍 | 申請(專利權)人: | 中國移動通信集團四川有限公司 |
| 主分類號: | G10L13/06 | 分類號: | G10L13/06;G10L15/26;G10L15/16;G06N3/04;G06N3/08 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 張穎玲;蔣雅潔 |
| 地址: | 610041 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 處理 方法 裝置 | ||
1.一種語音處理方法,其特征在于,所述方法包括:按預設業務類型對各標準業務文本進行分類,確定各標準業務文本的業務類型;所述方法還包括:
識別獲取的語音,并轉換成文本;確定轉換后文本的各基本語言單位、以及所述各基本語言單位的語言功能類別;
采用向量空間模型確定所述各基本語言單位對應的權值向量組成的權值向量矩陣;
根據所述各標準業務文本及其業務類型、和所述權值向量矩陣,確定所述權值向量矩陣中所述各權值向量對應的基本語言單位的業務類型;
根據所述各基本語言單位的業務類型和語言功能類別,將所述各基本語言單位組成輸出文本,并對所述輸出文本進行后處理;
其中,所述根據所述各基本語言單位的業務類型和語言功能類別,將所述各基本語言單位組成輸出文本,并對所述輸出文本進行后處理,包括:
預設對不同業務類型和語言功能類別的基本語言單位處理方法,對所述各基本語言單位進行屏蔽、和/或修正、和/或保持處理;
將處理完成的所述各基本語言單位組成所述輸出文本,根據所述業務類型和所述語言功能類別對所述輸出文本進行進一步處理。
2.根據權利要求1所述的方法,其特征在于,所述確定轉換后文本的各基本語言單位,包括:通過文本分詞,確定所述轉換后文本的字、和/或詞、和/或短語、和/或短句。
3.根據權利要求1所述的方法,其特征在于,所述根據所述各標準業務文本及其業務類型、和所述權值向量矩陣,確定所述權值向量矩陣中所述各權值向量對應的基本語言單位的業務類型,包括:
采用學習向量量化LVQ神經網絡分析所述權值向量矩陣;
采用向量空間模型確定所述各標準業務文本的權值向量,并將所述各分類的標準業務文本的權值向量確定為所述LVQ神經網絡的隱含層神經元的權值向量;
根據所述各標準業務文本的業務類型,預先確定勝出神經元對應的業務類型;
將所述向量矩陣設置為所述LVQ神經網絡的輸入向量,確定所述權值向量矩陣中各權值向量對應的業務類型;
根據所述權值向量矩陣中各權值向量對應的業務類型,確定所述各權值向量對應的所述各基本語言單位的業務類型。
4.根據權利要求1所述的方法,其特征在于,所述將所述各基本語言單位組成輸出文本,包括:
根據業務類型和語言功能類別,對所述各基本語言單位進行屏蔽、和/或修正、和/或保持處理,并將處理完成的所述各基本語言單位組成輸出文本。
5.根據權利要求1至4任一項所述的方法,其特征在于,所述對所述輸出文本進行后處理,包括:
將所述輸出文本轉換成語音;和/或,
根據所述輸出文本進行知識庫檢索;和/或,
對所述輸出文本中的具體業務內容進行具體業務辦理;和/或,
對所述輸出文本進行質檢。
6.根據權利要求1至4任一項所述的方法,其特征在于,所述按預設業務類型對各標準業務文本進行分類,包括:按非法業務和合法業務對各標準業務文本進行分類;
所述語言功能類別,包括:具體業務內容、和/或慣用詞、和/或中性名詞、和/或語氣詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團四川有限公司,未經中國移動通信集團四川有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610211171.8/1.html,轉載請聲明來源鉆瓜專利網。





