[發明專利]虛擬現實環境語言學習實現方法和自動錄音控制方法有效
| 申請號: | 201710644676.8 | 申請日: | 2017-08-01 |
| 公開(公告)號: | CN107403011B | 公開(公告)日: | 2020-08-07 |
| 發明(設計)人: | 龔嵩杰 | 申請(專利權)人: | 三星電子(中國)研發中心;三星電子株式會社 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G10L15/04;G06T19/00 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 謝安昆;宋志強 |
| 地址: | 210012 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 虛擬現實 環境 語言 學習 實現 方法 自動 錄音 控制 | ||
1.一種虛擬現實場景環境語言學習實現方法,其特征在于,至少包括以下步驟:
步驟a:進入虛擬現實場景應用程序中,所述場景包括至少一個用戶和至少一個虛擬人物;
步驟b:所述用戶和所述場景中的其他人員,按預設對話內容和預設的角色發言,直至所述對話內容結束;
所述其他人員包括所述場景中的其他用戶或虛擬人物;當發言對象為用戶時,用戶按承擔的角色自動控制地錄入相應的語音信息;當所述發言對象為虛擬人物時,所述虛擬人物按承擔的角色調用并播放所述對話內容中角色發言所對應的原始錄音,所述原始錄音為所述應用程序保存的所述對話內容的標準錄音;
其中,所述自動控制地錄入相應的語音信息,至少包括:
步驟300:進入錄音狀態,記錄用戶的語音數據并緩存;
步驟301:實時檢測用戶語音緩存數據中非靜音特征,若檢測到非靜音特征,則執行步驟302,否則返回步驟300;
步驟302:獲取用戶語音緩存數據中的非靜音特征的時長t1,根據所述時長t1,確定首部片段語音的提取時長t’2和尾部片段語音的提取時長為t’3,滿足t1≥t’2+t’3;
步驟303:分別提取原始錄音和所述用戶語音緩存數據中t1時長的首尾部片段語音,所述首部片段語音的提取時長為t’2,所述尾部片段語音的提取時長為t’3;
步驟304:比較所述原始錄音和所述用戶緩存語音數據中首尾部片段語音屬性的相似度,若相似度均大于第一預設值,則結束當前錄音,并保存所述緩存語音數據,否則返回步驟300。
2.根據權利要求1所述的方法,其特征在于,所述步驟302,還包括若t1≥t2+t3,令t’3=t3,t’2=t2;若t1t2+t3,令t’3=pt1,t’2=(1-p)t1,0p≤1;所述t2為首部片段語音的標準提取時長,所述t3為尾部片段語音的標準提取時長。
3.根據權利要求1所述的方法,其特征在于,所述步驟b,還包括,當其他人員發言時,修正所述發言的聲音播放頻率f為f':f'=γf,
其中,f為原始錄音或用戶錄入語音的頻率,所述γ值與所述其他人員和所述用戶之間的距離成反比。
4.根據權利要求3所述的方法,其特征在于,當所述其他人員和所述用戶的距離越來越小時,所述γ值大于1;當所述發言成員和所述用戶的距離越來越大時,所述γ值小于1。
5.根據權利要求4所述的方法,其特征在于,當所述其他人員和所述用戶的距離越來越小時,當所述發言成員和所述用戶的距離越來越大時,其中,vo為所述用戶移動速度,vs為所述其他人員的移動速度,所述其他人員和所述用戶之間的連線與所述vs之間的夾角為α,所述其他人員和所述用戶之間的連線與所述vo之間的夾角為β,v為聲音在空氣中的傳播速度。
6.根據權利要求1所述的方法,其特征在于,
所述步驟302進一步包括:將所述用戶緩存語音數據轉換為用戶輸入文本,比較所述用戶輸入文本與所述原始錄音所對應的原始文本的相似度,如果所述相似度大于第二預設值,則記錄第一比較結果;
所述步驟304進一步包括,如果首尾部片段語音特征相似度均大于第一預設值,則記錄第二比較結果;并將該第二比較結果、所述第一比較結果進行或運算或與運算,根據運算結果確定是否結束當前錄音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子(中國)研發中心;三星電子株式會社,未經三星電子(中國)研發中心;三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710644676.8/1.html,轉載請聲明來源鉆瓜專利網。





