[發明專利]控制裝置、語音交互裝置、語音識別服務器以及存儲介質有效
| 申請號: | 201911225321.0 | 申請日: | 2019-12-04 |
| 公開(公告)號: | CN111354351B | 公開(公告)日: | 2023-06-02 |
| 發明(設計)人: | 渡部生圣 | 申請(專利權)人: | 豐田自動車株式會社 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/22;G10L15/30 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 韓峰;孫志湧 |
| 地址: | 日本愛知*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 控制 裝置 語音 交互 識別 服務器 以及 存儲 介質 | ||
1.一種控制系統,包括:
中央處理單元,所述中央處理單元被配置成控制語音交互系統,所述語音交互系統包括存儲器和保持在所述存儲器中的多個語音識別模型,
其中,
所述多個語音識別模型包括:從所述多個語音識別模型當中已被暫時選擇的初始語音識別模型,一個或多個中間語音識別模型,以及所述多個語音識別模型當中的被估計為最佳的最佳語音識別模型;
當與對象者的會話開始時,所述中央處理單元指示所述語音交互系統來通過所述初始語音識別模型首先執行語音識別和響應生成,基于在語音識別服務器中的由所述對象者發出的話語的所述語音識別的結果來確定所述最佳語音識別模型,并且當所述最佳語音識別模型和所述初始語音識別模型彼此不同時,指示所述語音交互系統以將所述語音識別模型切換成所述最佳語音識別模型并且執行語音識別和響應生成;以及
當所述語音交互系統從所述初始語音識別模型切換成所述最佳語音識別模型時,所述中央處理單元促使所述語音交互系統從所述初始語音識別模型按階段地通過所述一個或多個中間語音識別模型以相似度的降序切換到所述最佳語音識別模型。
2.根據權利要求1所述的控制系統,其中,
所述初始語音識別模型是基于過去的會話信息而在所述語音交互系統中包括的所述多個語音識別模型當中的已經被確定為最頻繁使用的語音識別模型。
3.根據權利要求1所述的控制系統,其中,
當所述中央處理單元使確定了被估計為最佳的所述語音識別模型時,所述中央處理單元使考慮除了關于所述對象者的語音之外的信息。
4.一種語音交互系統,包括:
多個語音識別模型,以及
控制器,
其中,
所述多個語音識別模型包括:從所述多個語音識別模型當中已被暫時選擇的初始語音識別模型,一個或多個中間語音識別模型,以及所述多個語音識別模型當中的被估計為最佳的最佳語音識別模型;
當與對象者的會話開始時,所述控制器通過所述初始語音識別模型來首先執行語音識別和響應生成,基于在語音識別服務器中的由所述對象者發出在話語的所述語音識別的結果來確定所述最佳語音識別模型,當所述最佳語音識別模型和所述初始語音識別模型彼此不同時,從所述初始語音識別模型通過所述一個或多個中間語音識別模型以相似度的降序切換到所述最佳語音識別模型,將所述語音識別模型切換成所述最佳語音識別模型,并且所述最佳語音識別模型執行語音識別和響應生成。
5.一種控制語音交互系統的方法,所述語音交互系統包括多個語音識別模型,
所述多個語音識別模型包括:從所述多個語音識別模型當中已被暫時選擇的初始語音識別模型,一個或多個中間語音識別模型,以及所述多個語音識別模型當中的被估計為最佳的最佳語音識別模型,
所述方法包括以下步驟:
當與對象者的會話開始時,指示所述語音交互系統來通過所述初始語音識別模型首先執行語音識別和響應生成;
基于在語音識別服務器中的由所述對象者發出的話語的所述語音識別的結果來確定所述最佳語音識別模型;
當所述最佳語音識別模型和所述初始語音識別模型彼此不同時,指示所述語音交互系統以將所述語音識別模型切換成所述最佳語音識別模型并且執行語音識別和響應生成;以及
當所述語音交互系統從所述初始語音識別模型切換成所述最佳語音識別模型時,促使所述語音交互系統從所述初始語音識別模型按階段地通過所述一個或多個中間語音識別模型以相似度的降序切換到所述最佳語音識別模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于豐田自動車株式會社,未經豐田自動車株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911225321.0/1.html,轉載請聲明來源鉆瓜專利網。





