[發明專利]語音端點確定有效
| 申請號: | 201610825803.X | 申請日: | 2016-09-14 |
| 公開(公告)號: | CN107068147B | 公開(公告)日: | 2020-10-20 |
| 發明(設計)人: | 西迪·塔德帕特里卡爾;邁克爾·布坎南;普拉維爾·庫馬爾·古普塔 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/05;G06F40/20;G06F40/279 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 李寶泉;周亞榮 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 端點 確定 | ||
1.一種計算機實施的方法,包括:
由自動化語音識別系統的語音查詢處理器訪問包括由特定用戶說出的多個不同的語音查詢的語音查詢日志數據,所述自動化語音識別系統包括:(i)所述語音查詢處理器,(ii)用戶簡檔器,(iii)音頻子系統,(iv)端點確定處理器,以及(v)自動化語音識別器,所述語音查詢處理器包括停頓間隔處理器;
由所述自動化語音識別系統的所述停頓間隔處理器針對由所述特定用戶說出的所述多個不同的語音查詢確定所述多個不同的語音查詢的詞之間的平均停頓間隔;
由所述自動化語音識別系統的所述用戶簡檔器至少基于語音查詢經驗分值將所述特定用戶分類為所述自動化語音識別系統的專家用戶或者分類為所述自動化語音識別系統的新手用戶,所述語音查詢經驗分值基于由所述特定用戶說出的所述多個不同的語音查詢的詞之間的所述平均停頓間隔;
由所述自動化語音識別系統的所述用戶簡檔器至少基于將所述特定用戶分類為所述自動化語音識別系統的專家用戶或者分類為所述自動化語音識別系統的新手用戶,確定針對所述特定用戶的停頓閾值;
由所述自動化語音識別系統的所述音頻子系統接收與由所述特定用戶說出的話語相對應的音頻數據;
由所述自動化語音識別系統的所述端點確定處理器確定所述特定用戶已經在至少等于或大于針對所述特定用戶的所述停頓閾值的時間段內停止說話,針對所述特定用戶的所述停頓閾值是至少基于將所述特定用戶分類為所述自動化語音識別系統的專家用戶或者分類為所述自動化語音識別系統的新手用戶來確定的;
基于確定所述特定用戶已經在至少等于或大于針對所述特定用戶的所述停頓閾值的時間段內停止說話,由所述自動化語音識別系統的所述端點確定處理器生成指示所述特定用戶很可能已經停止說話的端點確定信號,針對所述特定用戶的所述停頓閾值是至少基于將所述特定用戶分類為所述自動化語音識別系統的專家用戶或者分類為所述自動化語音識別系統的新手用戶來確定的;以及
響應于生成指示所述特定用戶很可能已經停止說話的所述端點確定信號,由所述自動化語音識別系統的所述自動化語音識別器對與所述特定用戶所說出的所述話語相對應的所述音頻數據執行自動化語音識別。
2.根據權利要求1所述的方法,其中:
所述語音查詢日志數據包括與每個語音查詢相關聯的時間戳、指示每個語音查詢是否完整的數據、以及與每個語音查詢相關聯的語音停頓間隔,以及
由所述自動化語音識別系統的所述用戶簡檔器確定針對所述特定用戶的停頓閾值包括由所述自動化語音識別系統的所述用戶簡檔器基于與每個語音查詢相關聯的所述時間戳、指示每個語音查詢是否完整的所述數據、以及與每個語音查詢相關聯的所述語音停頓間隔來確定所述停頓閾值。
3.根據權利要求1所述的方法,包括:
由所述自動化語音識別系統的查詢計數器基于所述語音查詢日志數據,確定由所述特定用戶每天說出的語音查詢的平均數目,
其中,確定所述停頓閾值進一步基于由所述特定用戶每天說出的語音查詢的所述平均數目。
4.根據權利要求1所述的方法,包括:
由所述自動化語音識別系統的查詢長度處理器基于所述語音查詢日志數據,確定由所述特定用戶說出的語音查詢的平均長度,其中,確定所述停頓閾值進一步基于由所述特定用戶說出的語音查詢的所述平均長度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610825803.X/1.html,轉載請聲明來源鉆瓜專利網。





