[發明專利]虛擬偶像的狀態管理方法及系統有效
| 申請號: | 201810032045.5 | 申請日: | 2018-01-12 |
| 公開(公告)號: | CN108388399B | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 秦萌萌;賈志強;俞曉君 | 申請(專利權)人: | 北京光年無限科技有限公司 |
| 主分類號: | G06F3/0487 | 分類號: | G06F3/0487;G06F3/16;G06F3/0484 |
| 代理公司: | 北京聿華聯合知識產權代理有限公司 11611 | 代理人: | 朱繪;張文娟 |
| 地址: | 100000 北京市石景山區石景山*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 虛擬 偶像 狀態 管理 方法 系統 | ||
1.一種虛擬偶像的狀態管理方法,其特征在于,所述虛擬偶像具有特定的形象特征,并通過全息設備被展示出來,所述方法包含以下步驟:
獲取多模態輸入;
解析所述多模態輸入中的意圖或操作,以得到用于狀態轉化的轉化意圖或轉化指令;
將所述虛擬偶像的當前狀態轉化為所述轉化意圖或轉化指令指示的所述虛擬偶像的新狀態,虛擬偶像的狀態包括休眠狀態、活躍狀態和等待狀態,其中,休眠狀態包括:暫停狀態和待機狀態,活躍狀態包括:錄音狀態、音頻輸出狀態和技能開啟狀態,所述等待狀態是等待錄音狀態;
所述新狀態包括:開啟所述虛擬偶像在所述新狀態下所需要的能力或技能模塊;
在智能設備中的交互程序被激活后,進入到暫停狀態,虛擬偶像停止運行,當有激活事件發生時,進入等待錄音狀態,如果在等待錄音狀態下檢測到用戶說話,則轉化為錄音狀態,在錄音狀態下檢測音頻輸入信號,啟動能力或技能模塊中的錄制模塊記錄音頻輸入數據,如果處于錄音狀態,且檢測到用戶說話停止,則轉化為等待錄音狀態;
如果需要由錄音狀態切換為音頻輸出狀態,首先由錄音狀態轉化為等待錄音狀態,再由等待錄音狀態切換為音頻輸出狀態,處于音頻輸出狀態時,用戶可以與虛擬偶像展開對話交互,虛擬偶像會播放出與用戶交互的交互音頻,當交互音頻播放結束時,由音頻輸出狀態轉化為暫停狀態;
處于錄音狀態時,用戶表露出結束本次錄音的意愿,則轉化至待機狀態,等待用戶的下次多模態輸入,處于待機狀態時,如果用戶發出喚醒意圖或是指令,則轉化為等待錄音狀態,此處的喚醒意圖可以是虛擬偶像發出的特定音頻以及特定肢體動作或是用戶的特定生物特征;
如果需要由錄音狀態切換為技能開啟狀態,首先由錄音狀態轉化為等待錄音狀態,再由等待錄音狀態轉化為技能開啟狀態,處于技能開啟狀態時,調用能力或技能模塊中的歌舞表演模塊進行歌舞表演,當處于技能開啟狀態且歌唱完畢或是被打斷,則轉化為等待錄音狀態,當處于技能開啟狀態且虛擬偶像歌唱開始,則轉化為待機狀態。
2.如權利要求1所述的虛擬偶像的狀態管理方法,其特征在于,所述虛擬偶像的狀態分為休眠狀態、活躍狀態和等待狀態,其中,
休眠狀態包括:暫停狀態和待機狀態;
活躍狀態包括:錄音狀態、音頻輸出狀態和技能開啟狀態;
在暫停狀態下,停止運行所述虛擬偶像;
在待機狀態下,在后臺運行所述虛擬偶像;
在錄音狀態下,停止之前多模態輸出,開始檢測音頻信號;
在音頻輸出狀態下,調用所述能力或技能模塊中的語言交互模塊進行對話交互;
在技能開啟狀態下,調用所述能力或技能模塊中的歌舞表演模塊進行歌舞表演。
3.如權利要求2所述的虛擬偶像的狀態管理方法,其特征在于,所述等待狀態為之前狀態結束時的等待錄音狀態。
4.如權利要求1所述的虛擬偶像的狀態管理方法,其特征在于,
在所述等待錄音狀態下,結合云端大腦對所述多模態輸入的解析結果來確定要進入的狀態為音頻輸出狀態還是技能開啟狀態,并在進入音頻輸出狀態或者技能開啟狀態后,通過結合所述云端大腦的反饋來執行能力或技能模塊開啟的多模態輸出。
5.如權利要求2所述的虛擬偶像的狀態管理方法,其特征在于,
在任何一種活躍狀態下,如果檢測到當前狀態下的任務已經處理結束并且未檢測到任何多模態輸入數據時,將當前狀態轉化至休眠狀態中的待機狀態或暫停狀態。
6.如權利要求5所述的虛擬偶像的狀態管理方法,其特征在于,
所述活躍狀態中的錄音狀態的優先級最高,在虛擬偶像處于等待狀態即等待錄音狀態下,采集用戶語音以使得虛擬偶像進入錄音狀態。
7.一種存儲介質,其包含用于執行如權利要求1-6中任一項所述的方法步驟的一系列指令。
8.一種虛擬偶像,其特征在于,所述虛擬偶像具備特定的虛擬形象和預設屬性,采用如權利要求1-6中任一項所述的方法執行所述虛擬偶像的狀態轉化過程。
9.一種虛擬偶像的狀態管理系統,其特征在于,所述系統包含:
智能設備,其上裝載有如權利要求8所述的虛擬偶像,用于獲取多模態輸入,并具備自然語言理解、視覺感知、觸摸感知、語言語音輸出、情感表情動作輸出的能力;
全息設備,其用于獲取多模態輸入以及將如權利要求8所述的虛擬偶像的影像轉化為全息影像并顯示所述全息影像;
云端大腦,其用于在等待狀態下,根據對所述多模態輸入的解析結果來確定要進入的狀態為音頻輸出狀態還是技能開啟狀態,并在進入音頻輸出狀態或者技能開啟狀態后,決策如權利要求8所述的虛擬偶像的多模態輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京光年無限科技有限公司,未經北京光年無限科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810032045.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖片的批量整理方法及系統
- 下一篇:一種操作處理方法及移動終端





