[發明專利]語音識別結果的調整裝置及方法在審
| 申請號: | 201810352115.5 | 申請日: | 2018-04-18 |
| 公開(公告)號: | CN108364650A | 公開(公告)日: | 2018-08-03 |
| 發明(設計)人: | 趙鑫;陳孝良;蘇少煒;馮大航;常樂 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/04;G10L15/05;G06F17/27 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 任巖 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 應用場景 語音識別結果 過濾模塊 文本數據 敏感詞 匹配 調整裝置 語音信息 場景判斷模塊 語音輸入信息 語音信息轉換 智能語音設備 處理模塊 用戶體驗 語義理解 不一致 正確率 去除 刪除 場景 保留 優化 | ||
一種語音識別結果的調整裝置及方法,其中,該裝置包括:VAD模塊,將語音輸入信息劃分為句語音信息;ASR模塊,將句語音信息轉換為文本數據;場景判斷模塊,判斷句語音信息的當前應用場景;句首處理模塊,若該句首詞的應用場景與當前應用場景匹配,則進入過濾模塊;否則去除該句首詞,依次判斷其他詞的應用場景是否與當前應用場景匹配,直至下一個詞的應用場景與當前應用場景匹配,此時進入過濾模塊;過濾模塊,判斷敏感詞的發生場景是否與當前應用場景一致,若一致,則保留該文本數據中的敏感詞;若不一致,則刪除該文本數據中的敏感詞。本發明能夠優化語音識別結果,提高語義理解的正確率,增強智能語音設備的用戶體驗。
技術領域
本發明涉及語音處理領域,尤其涉及一種語音識別結果的調整裝置及方法。
背景技術
近兩年,智能語音設備例如智能音箱作為家庭場景中有效的人工智能交互入口,在國內外市場受到廣泛專注。智能音箱的應用使用戶解放了雙手,能夠更加便捷的獲取歌曲、新聞等媒體資源,了解天氣、交通等實時情況,和控制家用電器等。智能音箱的產生得益于深度學習等人工智能技術的發展,其背后涉及到噪聲消除、語音活動檢測(VAD)和自動語音識別(ASR)等多項復雜技術。但根據目前的技術,VAD和ASR都無法保證100%的正確率,有效提高語音識別率是保障智能音箱服務質量的關鍵。
區別于其他語音識別的場景,智能音箱具備口語化和多輪對話的特征,用戶可以通過多次口語化的表達控制智能音箱的行為,而現實情況是很多簡略的口語化表達的識別率不高。此外,在多輪對話場景下,VAD的誤判可能導致第一句的末尾詞語出現在第二句的開頭位置,這種結果也會對智能音箱的行為造成不良影響。另一方面,智能音箱作為獲取信息的入口,應該屏蔽色情、政治敏感等內容。在實際應用場景下,有些詞語在新聞播報中是允許的,但在問答場景中是禁止的,這就存在一定的問題。
發明內容
(一)要解決的技術問題
本發明的目的在于提供一種語音識別結果的調整裝置及方法,以解決上述的至少一項技術問題。
(二)技術方案
本發明的一方面,提供了一種語音識別結果的調整裝置,包括:
VAD模塊,用于判斷語音輸入信息中每句話的終止,將所述語音輸入信息劃分為至少一個句語音信息;
ASR模塊,用于將所述句語音信息轉換為文本數據;
場景判斷模塊,用于根據所述文本數據以及場景關聯詞庫,判斷所述句語音信息的當前應用場景;
句首處理模塊,用于判斷所述文本數據的句首詞的應用場景,并與所述當前應用場景進行匹配,若該句首詞的應用場景與當前應用場景匹配,則進行過濾模塊的處理;若所述場景關聯詞庫中不存在句首詞的應用場景或者該句首詞的應用場景與當前應用場景不匹配,則去除該句首詞,并依次判斷該文本數據中的其他詞的應用場景是否與當前應用場景匹配,直至下一個詞的應用場景與當前應用場景匹配,進行過濾模塊的處理;
過濾模塊,用于根據敏感詞庫,確定該文本數據中的敏感詞的發生場景,判斷該發生場景是否與當前應用場景一致,若一致,則保留該文本數據中的敏感詞;若不一致,則刪除該文本數據中的敏感詞。
在本發明的一些實施例中,所述場景判斷模塊根據所述文本數據以及場景關聯詞庫,判斷所述語音輸入信息的應用場景指,所述場景判斷模塊對所述文本數據進行分詞和詞性分析,確定其中的名詞信息;將所述名詞信息與場景關聯詞庫進行概率計算,將概率最大的應用場景確定為所述語音輸入信息的應用場景。
在本發明的一些實施例中,所述場景關聯詞庫用于定義每個詞的場景分布概率和各應用場景的默認動詞;所述敏感詞庫用于定義每個敏感詞的發生場景。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810352115.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于語音識別的智能監測家居系統
- 下一篇:語音識別方法和設備





