[發明專利]一種基于人工智能技術的語音識別打標分類方法在審
| 申請號: | 202010601445.0 | 申請日: | 2020-06-28 |
| 公開(公告)號: | CN111787167A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 陳冬輝;梁亞峰;樊萍;蔣晰明;方雷;方錦文;吳義君 | 申請(專利權)人: | 上海安錄宇高數據技術有限公司 |
| 主分類號: | H04M3/51 | 分類號: | H04M3/51;H04M3/42;G10L15/26;G10L25/51;H04L29/08 |
| 代理公司: | 合肥東邦滋原專利代理事務所(普通合伙) 34155 | 代理人: | 張海燕 |
| 地址: | 201100 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 人工智能 技術 語音 識別 分類 方法 | ||
1.一種基于人工智能技術的語音識別打標分類方法,其特征在于:包括以下步驟:
步驟(1).部署錄音服務程序在服務器端對通話進行錄音,并且對來去話分離錄制存儲;
步驟(2).錄音服務器將來去話錄音轉發給語音分析引擎,通過聲學模型轉換為對應的漢語音標符號、音標信息,再識別出最終對應的文本內容并存儲在Elasticsearch中;
步驟(3).部署智能質檢程序在服務器端,在智能質檢系統的參數配置模塊進行字典配置,包括擴展詞、停用詞;
步驟(4).錄音服務器在收到引擎返回的文本并寫入Elasticsearch的同時,Elasticsearch的分詞器就會按照已有的擴展詞、停用詞進行分詞;
步驟(5).系統按標簽類型設置語速標簽、靜音標簽、禁忌語標簽,根據標簽去查詢ES,獲得匹配文本,將匹配到的文本對應的錄音記錄打標簽,并將標簽數據寫入數據庫;
步驟(6).系統根據打標情況進行后續的查詢、歸類、評分操作。
2.根據權利要求1所述的一種基于人工智能技術的語音識別打標分類方法,其特征在于:所述步驟(1)中錄音存儲通過網絡交換機的鏡像功能,收取IP話機通話過程中產生的語音載波流和呼叫控制信令,利用服務器的CPU和內存資源,將線路的語音數據軟解成用戶定義的語音格式,錄音系統將話音采集后,通過數字壓縮處理將語音信息以數字信號方式先存儲在本地硬盤上,再按設定的時間間隔自動備份到存儲中心。
3.根據權利要求1所述的一種基于人工智能技術的語音識別打標分類方法,其特征在于:所述步驟(2)中錄音轉發及全文轉換過程為在錄音服務器上部署語音轉發接口,通過轉發接口將來去話分離的語音數據轉發給語音引擎,語音引擎首先將分離后的語音通過聲學模型轉換為對應的漢語音標符號,音標信息再通過超大詞匯網絡的語言模型識別出最終對應的結構化文本內容,文本內容包括來去話分離的文字,時長,語速等信息,再返回給錄音系統進行存儲在Elasticsearch中。
4.根據權利要求1所述的一種基于人工智能技術的語音識別打標分類方法,其特征在于:所述步驟(5)中標簽設置方法為基于Elasticsearch的智能質檢自動標簽技術是將Elasticsearch中海量的文本數據,通過用戶預先設定好的條件、檢索的方式自動將文本分類,從而實現將海量的錄音文件分類,繼而用于檢索調聽,分類歸檔,自動評分使用場景。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海安錄宇高數據技術有限公司,未經上海安錄宇高數據技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010601445.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種任務處理方法、裝置、電子設備及可讀存儲介質
- 下一篇:顯示面板和顯示裝置





