[發明專利]信息處理裝置和記錄介質在審
| 申請號: | 202010734400.0 | 申請日: | 2020-07-24 |
| 公開(公告)號: | CN112509571A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 內田翔 | 申請(專利權)人: | 富士通個人電腦株式會社 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/20;G10L21/0216;G10L13/04 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 朱麗娟;崔成哲 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 裝置 記錄 介質 | ||
本發明提供信息處理裝置和記錄介質,提高語音識別的精度。麥克風2a和2b將語音轉換成語音信號4a和4b。傳感器3檢測一個以上的人體的所在。傳感器輸出表示人體存在的一個以上的方向的傳感器數據5。信息處理裝置10基于從傳感器3取得的傳感器數據5所示的一個以上的方向來決定強化方向。然后,信息處理裝置10基于從麥克風2a和2b獲取的語音信號4a和4b,生成強調了來自強化方向的語音的合成語音信號。
技術領域
本發明涉及信息處理裝置和記錄介質。
背景技術
配備有麥克風的PC(個人計算機)已被廣泛普及。作為通過麥克風來減小噪聲地收集用戶的聲音的技術,有波束成型。在波束成型中,將使用多個無指向性麥克風收集到的多個語音信號合成,并強調來自特定方向的語音。例如,在電視電話中,為了使位于PC的屏幕前的用戶的聲音清楚,有時進行強調來自屏幕的正面方向的語音的設定。
作為與波束成型相關的技術,例如提出了實時地估計從移動的聲源發出的語音的到來方向,并且對該語音實時地進行波束成型的語音到來方向估計·波束成型系統。
現有技術文獻
專利文獻
[專利文獻1]特開2008-175733號公報
發明內容
[發明要解決的問題]
近年來,響應于用戶說出的話語來操作PC的語音輔助被組裝入PC中。用戶即使不在屏幕的正面,也可以通過對語音輔助說話來操作PC。
但是,在基于PC的波束成型中,有時設想用戶位于屏幕前,進行強調來自屏幕的正面方向的語音的設定。在這種情況下,對位于屏幕的正面以外的用戶的語音的語音識別的精度降低。
另外,如上述的語音到來方向估計·波束成型系統那樣,可以實時地估計從移動的聲源發出的語音的到來方向。但是,在該技術中,從移動的聲源發出語音是到來方向估計的前提,所以難以估計說話前的用戶的方向、用戶安靜地大幅移動后的用戶的方向。在不能估計用戶的方向的情況下,基于波束成型的語音識別的精度也不夠。
本發明的一個方面的目的是提高語音識別的精度。
[用于解決問題的手段]
在一個方案中,提供了具有如下所述的多個麥克風、傳感器和處理部的信息處理裝置。
多個麥克風將語音轉換為語音信號。傳感器檢測一個以上的人體的所在。傳感器輸出表示人體存在的一個以上方向的傳感器數據。處理部基于從傳感器取得的傳感器數據所示的一個以上的方向來決定強化方向。并且,處理部根據從多個麥克風取得的多個語音信號,生成強調了來自強化方向的語音的合成語音信號。
[發明效果]
根據一個方式,能夠提高語音識別的精度。
附圖說明
圖1是表示第1實施方式的信息處理裝置的一例的圖。
圖2是用于說明第2實施方式的概要的圖。
圖3是表示用戶終端的硬件的一例的圖。
圖4是表示監視器的結構的一例的圖。
圖5是表示用戶終端的功能例的框圖。
圖6是表示語音的傳送方法的一例的圖。
圖7是通過傳感器輸出人體的位置坐標的方法的一例。
圖8是強化方向的決定方法的一例。
圖9是表示設置位置信息的一例的圖。
圖10是表示第1強化方向控制的過程的一例的流程圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通個人電腦株式會社,未經富士通個人電腦株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010734400.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:自動售貨機的商品樣品展示裝置
- 下一篇:把手開關總成





