[發明專利]一種基于對話設備的智能語音交互方法在審
| 申請號: | 201810827885.0 | 申請日: | 2018-07-25 |
| 公開(公告)號: | CN109036388A | 公開(公告)日: | 2018-12-18 |
| 發明(設計)人: | 李智彤;李達 | 申請(專利權)人: | 李智彤;李達 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/22;G10L15/26;G10L13/02;G06F17/30 |
| 代理公司: | 杭州杭誠專利事務所有限公司 33109 | 代理人: | 尉偉敏 |
| 地址: | 510000 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲線 語音交互 智能語音交互 使用者聲音 使用者語音 播放策略 對話設備 模型參數 更新 反饋 交互語音 內容合成 聲音合成 語音對話 真人語音 錄制 播放 監測 分析 | ||
本發明涉及語音對話技術領域,具體涉及一種基于對話設備的智能語音交互方法,包括以下步驟:A)建立標準聲線模型,錄制真人語音,調整標準聲線模型參數,生成真人專屬聲線模型;B)根據交互內容建立或更新包括語速、語調或語氣中至少一項的播放策略,根據播放策略調整真人專屬聲線模型參數,將交互內容代入調整后的真人專屬聲線模型,生成交互語音并播放;C)監測使用者聲音,根據使用者聲音更新交互內容。本發明的有益效果是:通過語音交互過程中收集使用者語音,分析得出使用者語音交互的反饋,根據反饋對交互內容合成音的聲音合成策略進行調整或更新語音交互內容,增強使用者參與感,提高語音交互效果。
技術領域
本發明涉及語音對話技術領域,具體涉及一種基于對話設備的智能語音交互方法。
背景技術
目前人工智能技術迅猛發展,在多個技術領域中體現了其巨大的優勢作用,尤其在聲音合成領域取得的最新進展,通過人工智能程序已經可以合成出足夠比擬真人聲音的合成音,普通人難以將人工智能合成音與真人聲音區分開來,且人工智能程序能夠將被模仿人未曾說過的語句,通過程序合成出來。這項技術已經有了多個領域及方向的應用,其中一個就是能夠模擬真人對話的對話設備。當對話設備的使用者為兒童時,能夠為兒童提供樂趣和陪伴。在當前社會壓力增大,節奏變快,家長陪伴兒童的時間越來越被擠壓的情況下,人工智能實現的對話設備對于兒童陪伴作用,有助于兒童的快樂健康成長。尤其是睡前給兒童講故事的活動,是具有傳統特色的親子活動。有助于兒童形成健康完善的性格及人格體系,對兒童日后的健康發展具有關鍵和重要的意義。而快節奏的工作生活,使得家長陪伴兒童的這項親子活動通常無法很好實現和持續。雖然在利用對話設備講故事過程中,兒童缺少目視親人的視覺體驗,以及觸感體驗,但申請人認為僅依靠聲音仍然足夠建立起沉浸式的富有陪伴感和親切感的體驗。其原因在于當一個人足夠專注聲音信息時,會減弱對視覺以及觸覺的感受,甚至忽略視覺與觸覺。這一規律對于兒童以及成年人均適用。
然而在語音交互中需要檢測到使用者的使用反饋,獲得使用反饋的方法為監測使用者語音。當使用者為兒童時,會因為兒童并不能很好的使用語音及時準確的表達自己的使用感受和實時需要,難以清楚表達自己的需求;而且兒童在不感興趣、害怕、興奮等時,并不會發出聲音,對話設備也沒有相應的傳感器進行檢測;以及兒童容易注意力分散,不能保證對語音交互的足夠持續時間關注,導致語音交互中兒童參與度低,效果差。由于兒童反饋信息的收集困難,以及兒童注意力集中時間短的問題,導致語音交互設備的使用者為兒童時,語音交互效果差。
中國專利CN103680222B,公開日2017年10月24日,一種兒童故事問答交互方法,包括步驟1:在兒童與故事交互系統進行交互之初,系統首先判斷交互類型,如是系統主動講故事,則執行步驟2;如是點播,則執行步驟3;步驟2:系統將獲取交互歷史信息和兒童模型信息,并據此從兒童故事庫和故事問題庫選擇故事類別及內容;步驟3:播放所擇故事;步驟4:在智能故事交互控制的引導下,執行智能交互動作;步驟5:系統根據步驟4選擇的候選SIDL交互動作,執行相應動作;步驟6:系統得到兒童的反饋信息,并記錄交互歷史信息;步驟7:更新交互歷史信息,并根據更新后的交互歷史信息重新計算兒童模型;步驟8:判斷故事對話結束條件是否滿足,若滿足,則結束本次故事對話,否則轉到步驟4重新執行。其交互動作為預設交互動作集里的動作,雖然每次動作可以從集中選擇并列動作中的另一個進行,但其目的僅是為了增加在講故事過程中的趣味性,交互動作仍然是固定程式固定方式的動作,其交互目的并不是為了獲取兒童聽故事過程中的反饋進而調節講故事策略。在僅能增加趣味性之后,不能增加兒童的存在感和陪伴感,更不能起到助于兒童健康成長的作用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于李智彤;李達,未經李智彤;李達許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810827885.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:視頻語音識別方法及系統
- 下一篇:一種對抗樣本的生成方法及裝置





