[發(fā)明專利]自適應的人機語音對話裝置和設備、交互系統(tǒng)和車輛在審
| 申請?zhí)枺?/td> | 201910598109.2 | 申請日: | 2019-07-04 |
| 公開(公告)號: | CN112185368A | 公開(公告)日: | 2021-01-05 |
| 發(fā)明(設計)人: | 雷文輝;張曉竹;朱江;周曉穎;賴勝;G·哈默雷爾;孫錫 | 申請(專利權)人: | 寶馬股份公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/18;G10L15/26;G10L15/02;G10L13/08 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 劉盈 |
| 地址: | 德國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自適應 人機 語音 對話 裝置 設備 交互 系統(tǒng) 車輛 | ||
1.自適應的人機語音對話裝置(200),包括:
-語音獲取模塊(201),用于獲取語音信息(11);
-語音識別模塊(202),用于生成語音信息對應的文本信息(12);
-語義理解模塊(203),用于分析語音信息對應的語義信息(13);
-對話管理模塊(204);用于根據(jù)語義信息決定對話過程;
-對話生成模塊(205),用于基于對話過程生成對話文本(15);
其特征在于,所述人機語音對話裝置進一步包括:
-語音片段形成模塊(207),用于從由語音獲取模塊(201)所獲取的語音信息(11)和由語音識別模塊(202)所生成的文本信息(12)形成語音片段組;
-語音合成模塊(209),用于基于所形成的語音片段組和所生成的對話文本(15)合成語音對話。
2.如權利要求1所述的人機語音對話裝置(200),其特征在于,所述語音合成模塊(209)包括音色調整模塊(208),所述音色調整模塊在生成語音對話時控制語速、音調、音量和音頻碼率中至少一項。
3.如權利要求1或2所述的人機語音對話裝置(200),其特征在于,所述語音片段形成模塊(207)通過如下方式形成語音片段組:
-在由語音識別模塊(202)所生成的文本信息(12)中搜索與預設的模板中相同的信息片段;
-從由語音獲取模塊(201)所獲取的語音信息截取與所述信息片段對應的語音信息;
-將所截取的語音信息與信息片段對應地存儲為語音片段組。
5.如權利要求1至4之一所述的人機語音對話裝置(200),其特征在于,所述語音識別模塊(202)用于:
通過聲學模型和語言模型利用自動語音識別技術將用戶(10)的語音識別為文本。
6.如權利要求1至5之一所述的人機語音對話裝置(200),其特征在于,所述語義理解模塊(203)用于:
-確定對話中的領域;
-分析用戶(10)的意圖;和
-獲得對話中的語義信息(13)。
7.如權利要求1至6之一所述的人機語音對話裝置(200),其特征在于,所述對話管理模塊(204)用于:
-確定對話上下文;
-跟蹤對話狀態(tài);和
-確定對話策略。
8.如權利要求3至7之一所述的人機語音對話裝置(200),其特征在于,所述預設的模板包括語句、短語、單詞、字和音素中的至少一項。
9.人機語音交互系統(tǒng),其特征在于,包括:
-一個如權利要求1-8之一所述的自適應的人機語音對話裝置(200);
-至少一個麥克風,用于采集語音信息;和
-至少一個揚聲器,用于播放語音對話。
10.車輛,其特征在于,所述車輛包括權利要求9所述的人機語音交互系統(tǒng)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寶馬股份公司,未經寶馬股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910598109.2/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種供熱管網(wǎng)的調控方法
- 下一篇:一種能嵌入廣告的車牌識別立柱





