[發明專利]一種客服語音智能搜索和分析系統及方法在審

申請號：	201410048066.8	申請日：	2014-02-11
公開（公告）號：	CN103793515A	公開（公告）日：	2014-05-14
發明（設計）人：	易中華;武全勝;陸登;王平華	申請（專利權）人：	安徽科大訊飛信息科技股份有限公司
主分類號：	G06F17/30	分類號：	G06F17/30;G06Q30/02
代理公司：	北京科迪生專利代理有限責任公司 11251	代理人：	成金玉
地址：	230088 安徽省***	國省代碼：	安徽;34
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種客服語音智能搜索分析系統方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及一種語音的搜索和分析系統及方法，屬于電子信息技術領域。

背景技術

電信、移動等呼叫中心有著大量的客服錄音數據，這些數據中包含著客戶需求等大量的有用信息。從消費者行為學的角度來說，客戶與客服座席的每一次交互都可以反饋出其當前的消費情況和下一步的消費行為趨勢。客戶對于產品的喜好程度、關注焦點、心理預期等都會通過座席代表向企業反饋。但包含著客戶需求等大量有用信息的語音數據很難進行搜索和分析，如同擁有語音寶藏但卻沒有打開寶藏的鑰匙；

目前，呼叫中心用于分析的數據主要來源于座席代表所標注的來電原因和投訴建議等信息。受數據來源的限制，在以下方面存在明顯不足：（1）僅能被動的看出知識庫所列來電原因分布情況，客戶深層來電訴求、希望解決的問題、關注的焦點等更深入的數據受熱線壓力以及一線人員素質等因素未能展現，同時將這些客戶行為特征與客戶年齡段、APRU值、套餐類型、業務偏好、市場活動等方面結合起來的綜合性營銷分析也無法開展；（2）在目前的一些客戶營銷手段中，例如采取通過專用的模型進行預測撥號，并通過一定的策略選取號段進行外呼營銷的客戶營銷手段，由于各種原因，營銷成功率僅有3%。面對絕大多數營銷未成功的海量電話，如何準確定位原因，如何從客戶角度分析進行改善提供，而對成功營銷的電話，如何分析其中的成功點進行復制推廣，目前還缺少較好的語音搜索和分析方法，無法從錄音中獲取結構化的信息進行分析改善。

發明內容

本發明的技術解決問題：克服現有技術的不足，提供一種語音搜索和分析系統及方法，通過對語音中包含的信息進行深度挖掘，從而檢索出語音中包含的關鍵詞以及關鍵詞出現的位置等特征信息。通過語音分析可以有效地對海量錄音文件、音頻文件進行分析處理，實現語音中的知識挖掘和對語音文件的快速檢索，解決了對語音數據的搜索和分析難題。

本發明的技術解決方案：本發明提供一種語音搜索和分析系統，包括語音轉寫、建立索引、語音檢索和文本分析四個模塊，如圖1所示：

語音轉寫模塊，實現語音數據向文本數據的轉換；接收語音數據并應用語音識別技術進行轉寫生成文本和屬性信息；所述語音識別技術實現過程為：首先進行模數轉換，將語音數據數字化，得到錄音的數字化信息；再對數字化后的信息進行VAD處理，也就是把首尾端的靜音切除，降低對后續步驟造成的干擾，得到VAD段；基于VAD段和特征提取技術區分語音對話角色實現場景分割功能，并將結果以文本形式輸出，包括語音對話內容、語音時長、靜音信息，至此完成了語音轉寫過程，并將文本和語音屬性信息結果傳送至建立索引模塊進行結構化建索；

建立索引模塊，對從語音轉寫模塊接收的文本和語音屬性信息進行結構化處理，生成結構化數據；再對生成的結構化數據應用全文搜索引擎技術建立索引，生成可以進行文本分析和搜索的索引數據，并提供索引查詢和分析接口，供語音檢索和文本分析使用；

語音檢索模塊，基于建立索引模塊的索引查詢和接口進行語音搜索，使用全文搜索引擎技術傳輸關鍵詞、模型、專題、原始維度作為搜索條件進行搜索，返回匹配的錄音信息列表，用戶可以直接以文字形式查看錄音信息列表中的錄音，也可以直接以測聽語音的形式查看錄音，至此已完成語音搜索功能；

文本分析模塊，同樣基于建立索引模塊的索引和接口進行文本分析，多種分析工具可以使用，以建立模型方式進行分類分析，使用熱詞工具獲取熱詞排行并進行變化趨勢分析，直接以關鍵詞搜索方式進行文本分析，使用維度鉆取方式進行條件過濾分析，結合模型、關鍵詞、維度鉆取等方式進行多維交叉分析，多角度、多層次、可視化挖掘海量數據，獲取趨勢信息、熱點信息、競爭信息等用戶關心的指向性數據；然后以圖形、表格等形式向用戶展示分析產生的這些指向性數據，達到高效溝通的目的，至此完成文本分析功能；

本發明的語音搜索和分析方法實現步驟如下：

第一步，進行語音轉寫，實現語音數據向文本數據的轉換；接收語音數據并應用語音識別技術進行轉寫生成文本和屬性信息；所述語音識別技術實現過程為：首先進行模數轉換，將語音數據數字化，得到錄音的數字化信息；再對數字化后的信息進行VAD處理，也就是把首尾端的靜音切除，降低對后續步驟造成的干擾，得到VAD段；基于VAD段和特征提取技術區分語音對話角色實現場景分割功能，并將結果以文本形式輸出，包括語音對話內容、語音時長、靜音信息，至此完成了語音轉寫過程，并將文本和語音屬性信息結果傳送至建立索引模塊進行結構化建索；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于安徽科大訊飛信息科技股份有限公司，未經安徽科大訊飛信息科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410048066.8/2.html，轉載請聲明來源鉆瓜專利網。