[發明專利]一種基于對話設備的智能語音交互方法在審
| 申請號: | 201810827885.0 | 申請日: | 2018-07-25 |
| 公開(公告)號: | CN109036388A | 公開(公告)日: | 2018-12-18 |
| 發明(設計)人: | 李智彤;李達 | 申請(專利權)人: | 李智彤;李達 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/22;G10L15/26;G10L13/02;G06F17/30 |
| 代理公司: | 杭州杭誠專利事務所有限公司 33109 | 代理人: | 尉偉敏 |
| 地址: | 510000 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲線 語音交互 智能語音交互 使用者聲音 使用者語音 播放策略 對話設備 模型參數 更新 反饋 交互語音 內容合成 聲音合成 語音對話 真人語音 錄制 播放 監測 分析 | ||
1.一種基于對話設備的智能語音交互方法,其特征在于,
包括以下步驟:
A)建立標準聲線模型,錄制真人語音,調整標準聲線模型參數,生成真人專屬聲線模型;
B)根據交互內容建立或更新播放策略,根據播放策略調整真人專屬聲線模型參數,將交互內容代入調整后的真人專屬聲線模型,生成交互語音并播放;
C)監測使用者聲音,根據使用者聲音更新交互內容。
2.根據權利要求1所述的一種基于對話設備的智能語音交互方法,其特征在于,
所述錄制真人語音時,錄制真人在至少兩個語境下的語音,分別建立對應所錄制語境下的真人專屬聲線模型,所述步驟B中的播放策略包括語境的選擇和更新。
3.根據權利要求1或2所述的一種基于對話設備的智能語音交互方法,其特征在于,
所述交互內容為兒童讀物,所述兒童讀物文本標注有預設提問,所述預設播放策略根據所述標注暫停兒童讀物播放,并播放預設提問,而后收集兒童回答語音。
4.根據權利要求3所述的一種基于對話設備的智能語音交互方法,其特征在于,
所述收集兒童回答語音時,分析回答語義,當回答語義超出設定范圍的次數,達到設定閾值N1時,采取以下a~f播放策略中的至少一種:a.重復播放預設問題一次,并重新收集時間T內的兒童回答語音;b.提高兒童讀物播放音量;c.增大兒童讀物播放聲音對比度;d.更換不同語境下的真人專屬聲線模型;e.更換不同真人的真人專屬聲線模型;f.播放預設互動提問,根據回答更換兒童讀物或真人專屬聲線模型;
若采取上述a~f播放策略中任一播放策略后,兒童回答后續預設問題的回答語義超出設定范圍時,通過通信模塊連線家長。
5.根據權利要求3所述的一種基于對話設備的智能語音交互方法,其特征在于,
所述收集兒童回答語音時,記錄兒童回答語音,并計算兒童開始回答時刻與預設問題播放完成時刻的間隔時間t,當兒童回答預設問題的間隔時間t平均值超過設定閾值t1時,采取以下a~f播放策略中的至少一種:a.重復播放預設問題一次,并重新收集時間T內的兒童回答語音;b.提高兒童讀物播放音量;c.增大兒童讀物播放聲音對比度;d.更換不同語境下的真人專屬聲線模型;e.更換不同真人的真人專屬聲線模型;f.播放預設互動提問,根據回答更換兒童讀物或真人專屬聲線模型;
若采取上述a~f播放策略中任一播放策略后,兒童回答后續預設問題的間隔時間t超過設定閾值t2,通過通信模塊連線家長。
6.根據權利要求3所述的一種基于對話設備的智能語音交互方法,其特征在于,
所述收集兒童回答語音時,記錄兒童回答語音及語義和開始回答時刻與預設問題播放完成時刻的間隔時間t作為兒童聽兒童讀物反應的反饋信息,當某次兒童回答預設問題的間隔時間t超過設定閾值t1且回答語義超出設定范圍時,通過通信模塊推送給家長,由家長判斷兒童的回答是否視為落入預設范圍,若視為落入預設范圍,則提高設定閾值t1。
7.根據權利要求3所述的一種基于對話設備的智能語音交互方法,其特征在于,
所述兒童讀物內容包括兒童讀物文本和預設標注,所述預設標注標注在兒童讀物文本上,所述預設標注與播放策略通過建立或更新映射關系表互相映射。
8.根據權利要求1或2所述的一種基于對話設備的智能語音交互方法,其特征在于,
在步驟B中根據交互內容語義建立或更新播放策略,所述交互內容語義的來源為文本識別和/或人工標注;
所述文本識別的方法為:建立文本與語義的映射庫,文本與所述映射庫匹配獲得文本語義;
所述人工標注的方法為在對應文本上標注語義,所述語義與播放策略通過建立或更新映射關系表互相映射。
9.根據權利要求1或2所述的一種基于對話設備的智能語音交互方法,其特征在于,
在所述步驟C中,監測使用者聲音時,實時進行語義識別,若語義識別出使用者提出問題,則根據預設回答庫選擇回答文本并代入真人專屬聲線模型生成語音回答。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于李智彤;李達,未經李智彤;李達許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810827885.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:視頻語音識別方法及系統
- 下一篇:一種對抗樣本的生成方法及裝置





