[發明專利]一種自動生成基于地方方言的訊或詢問筆錄的方法在審
| 申請號: | 201810929477.6 | 申請日: | 2018-08-15 |
| 公開(公告)號: | CN109243460A | 公開(公告)日: | 2019-01-18 |
| 發明(設計)人: | 徐甲甲;費先江;盛馬寶;廖志明 | 申請(專利權)人: | 浙江訊飛智能科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/22;G10L15/14;G10L15/06;G10L15/08 |
| 代理公司: | 杭州融方專利代理事務所(普通合伙) 33266 | 代理人: | 沈相權 |
| 地址: | 311201 浙江省杭州市蕭山區*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地方方言 自動生成 詢問 模型訓練模塊 語音處理模塊 語音識別模塊 辦事效率 | ||
本發明專利涉及一種訊或詢問筆錄的方法,尤其涉及一種自動生成基于地方方言的訊或詢問筆錄的方法。按以下步驟進行:前端語音處理模塊→后端語音識別模塊→模型訓練模塊。一種自動生成基于地方方言的訊或詢問筆錄的方法,進一步提高辦事效率和準確性。
技術領域
本發明專利涉及一種訊或詢問筆錄的方法,尤其涉及一種自動生成基于地方方言的訊或詢問筆錄的方法。
背景技術
中國上下五千年,歷史悠久,文化一脈相承,又地大物博,但是因為地域廣闊所以各地也有各自的風俗習慣,同時也語言豐富多彩。
以杭州市蕭山區為例,目前常住人口約150萬人,隨著蕭山經濟的迅猛發展,社會矛盾日益凸顯,各類違法犯罪案件呈現逐年上升趨勢。公安機關肩負的責任和承擔的工作任務越來越重。多年來案多人少、辦案力量不足,一直是基層比較突出的問題。辦案力量不足,不僅影響本職工作的開展,還影響其他工作的有效發揮和齊頭并進。如何提高工作效率以破解“案多人少”的難題,如何革新現有技術手段以簡化工作人員辦公過程,成為當前公安領域日益凸顯的問題。公安民警在處理各種案件時都需要制作筆錄,筆錄是公安民警審訊過程中常用到的取證手段。目前很多地方的民警在制作筆錄的時候普遍采用手寫形式。由于傳統手工筆錄制作非常耗時,也容易存在字跡潦草、記錄不完整、制作不規范等問題而嚴重影響筆錄的質量和法律效力。采用語音識別技術(尤其是針對蕭山方言的語音識別技術)實現交談語音數據的實時自動內容識別,可以解放公安民警的雙手,讓公安民警專注案件的分析和偵查,方便警務人員迅速辦理、審查案件,提高筆錄制作的速度和效率。
發明內容
本發明主要是解決現有技術中存在的不足,提供建立一套針對日常交談、能夠將報案人或嫌疑人說的任意連續語音通過計算機自動轉寫為對應的文字系統的一種自動生成基于地方方言的訊或詢問筆錄的方法。
本發明的上述技術問題主要是通過下述技術方案得以解決的:
一種自動生成基于地方方言的訊或詢問筆錄的方法,按以下步驟進行:
(一)、前端語音處理模塊:
針對輸入的語音,首先使用基于能量及模型的VAD技術進行分段,再采用基于模型的聚類技術對原始語音中的人聲、非語音、背景噪音相關現象進行自動判別及歸類,再進一步針對不同說話人進行聚類,針對分割后的語音提取對語音識別有效的、對噪聲魯棒性較好的聲學特征,同時為了消除不同說話人對識別效果的影響,首先會從特征域盡可能去除說話人的信息,主流的特征域處理方式包括VTLN、HLDA、特征域SAT相關技術,通過這些關鍵技術的加入,可以獲得冗余信息更少、說話人信息被去除的聲學特征,為后續的語音識別做好準備;
(二)、后端語音識別模塊:
為了將各語音轉寫關鍵技術點進行更好的整合,并綜合考慮識別效果和識別效率相關因素,在系統中將使用多編解碼框架:首先使用簡單聲學模型和低階語言模型,簡單聲學模型是指模型復雜度較小、未去除說話人信息;低階語言模型是指三階且模型復雜度較小;并結合WFST解碼器進行一遍的快速解碼,并生成對應的詞圖空間,該詞圖空間具有覆蓋性好、結構緊致的特點;
接著,將絕大多數對性能提升的核心技術點放到二遍解碼中,包括特征規整、區分性特征、模型區分性訓練、模型自適應,并在二遍解碼中相應使用更加復雜的聲學模型和超大規模高階語言模型,在詞圖空間中采用重新打分的方式輸出二遍解碼結果;雖然二遍解碼融入了各關鍵技術點,且模型復雜度相對于一編解碼提升很多,但是由于基于該詞圖空間的搜索范圍小了很多,二遍解碼的效率非常高;基于上述多編解碼框架,不僅能將各轉寫技術點的性能提升發揮出來,在效率上還有巨大的優勢;
置信度判決是后端語音識別系統中重要的后處理模塊,針對識別結果中可能出現的錯誤通過詞后驗概率技術給出識別結果對應的可信度得分,對可信度低的識別結果進行智能拒識;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江訊飛智能科技有限公司,未經浙江訊飛智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810929477.6/2.html,轉載請聲明來源鉆瓜專利網。





