[發(fā)明專利]語音處理裝置、語音處理方法以及記錄介質(zhì)在審
| 申請?zhí)枺?/td> | 201980038331.5 | 申請日: | 2019-05-15 |
| 公開(公告)號: | CN112262432A | 公開(公告)日: | 2021-01-22 |
| 發(fā)明(設(shè)計)人: | 鐮田智恵 | 申請(專利權(quán))人: | 索尼公司 |
| 主分類號: | G10L15/28 | 分類號: | G10L15/28;G06F3/0487;G06F3/16;G10L15/10 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責任公司 11240 | 代理人: | 余剛 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 處理 裝置 方法 以及 記錄 介質(zhì) | ||
1.一種語音處理裝置,包括:
聲音收集單元,被配置為收集語音并且將所收集的語音存儲在語音存儲單元中;
檢測單元,被配置為檢測用于啟動與所述語音相對應(yīng)的預(yù)定功能的觸發(fā);以及
執(zhí)行單元,被配置為在通過所述檢測單元檢測到所述觸發(fā)的情況下基于在檢測到所述觸發(fā)之前收集的語音來控制所述預(yù)定功能的執(zhí)行。
2.根據(jù)權(quán)利要求1所述的語音處理裝置,其中,所述檢測單元對通過所述聲音收集單元收集的所述語音執(zhí)行語音識別作為所述觸發(fā),并且檢測作為用于啟動所述預(yù)定功能的所述觸發(fā)的語音的喚醒字。
3.根據(jù)權(quán)利要求1所述的語音處理裝置,其中,所述聲音收集單元從所收集的語音中提取話語,并且將所提取的話語存儲在所述語音存儲單元中。
4.根據(jù)權(quán)利要求3所述的語音處理裝置,其中,在通過所述檢測單元檢測到所述喚醒字的情況下,所述執(zhí)行單元從存儲在所述語音存儲單元中的所述話語中提取與發(fā)出所述喚醒字的用戶相同的所述用戶的話語,并且基于所提取的話語來控制所述預(yù)定功能的執(zhí)行。
5.根據(jù)權(quán)利要求4所述的語音處理裝置,其中,在通過所述檢測單元檢測到所述喚醒字的情況下,所述執(zhí)行單元從存儲在所述語音存儲單元中的所述話語中提取與發(fā)出所述喚醒字的所述用戶相同的所述用戶的所述話語和預(yù)先注冊的預(yù)定用戶的話語,并且基于所提取的話語來控制所述預(yù)定功能的執(zhí)行。
6.根據(jù)權(quán)利要求1所述的語音處理裝置,其中,所述聲音收集單元接收關(guān)于要存儲在所述語音存儲單元中的所述語音的信息量的設(shè)置,并且將在所接收的設(shè)置的范圍內(nèi)收集的語音存儲在所述語音存儲單元中。
7.根據(jù)權(quán)利要求1所述的語音處理裝置,其中,在接收用于刪除存儲在所述語音存儲單元中的所述語音的請求的情況下,所述聲音收集單元刪除存儲在所述語音存儲單元中的所述語音。
8.根據(jù)權(quán)利要求1所述的語音處理裝置,進一步包括:
通知單元,被配置為在通過所述執(zhí)行單元使用在檢測到所述觸發(fā)之前收集的語音來控制所述預(yù)定功能的執(zhí)行的情況下通知用戶。
9.根據(jù)權(quán)利要求8所述的語音處理裝置,其中,所述通知單元在使用在檢測到所述觸發(fā)之前收集的語音的情況與使用在檢測到所述觸發(fā)之后收集的語音的情況之間以不同的模式進行通知。
10.根據(jù)權(quán)利要求8所述的語音處理裝置,其中,在使用在檢測到所述觸發(fā)之前收集的語音的情況下,所述通知單元將與所使用的語音相對應(yīng)的日志通知所述用戶。
11.根據(jù)權(quán)利要求1所述的語音處理裝置,其中,在通過所述檢測單元檢測到所述觸發(fā)的情況下,所述執(zhí)行單元使用在檢測到所述觸發(fā)之前收集的語音和在檢測到所述觸發(fā)之后所收集的語音來控制所述預(yù)定功能的執(zhí)行。
12.根據(jù)權(quán)利要求1所述的語音處理裝置,其中,所述執(zhí)行單元基于所述用戶對所述預(yù)定功能的執(zhí)行的反應(yīng)調(diào)整在檢測到所述觸發(fā)之前收集并且用于執(zhí)行所述預(yù)定功能的語音的信息量。
13.根據(jù)權(quán)利要求1所述的語音處理裝置,其中,所述檢測單元對通過對用戶成像而獲得的圖像執(zhí)行圖像識別作為所述觸發(fā),并且檢測所述用戶的注視視線。
14.根據(jù)權(quán)利要求1所述的語音處理裝置,其中,所述檢測單元檢測通過感測用戶的預(yù)定動作或距所述用戶的距離而獲得的信息作為所述觸發(fā)。
15.一種由計算機執(zhí)行的語音處理方法,所述語音處理方法包括:
收集語音并且將所收集的語音存儲在語音存儲單元中;
檢測用于啟動與所述語音相對應(yīng)的預(yù)定功能的觸發(fā);并且
在檢測到所述觸發(fā)的情況下基于在檢測到所述觸發(fā)之前收集的語音來控制所述預(yù)定功能的執(zhí)行。
16.一種記錄用于使計算機用作下列項的語音處理程序的計算機可讀非易失性記錄介質(zhì):
聲音收集單元,被配置為收集語音并且將所收集的語音存儲在語音存儲單元中;
檢測單元,被配置為檢測用于啟動與所述語音相對應(yīng)的預(yù)定功能的觸發(fā);以及
執(zhí)行單元,被配置為在通過所述檢測單元檢測到所述觸發(fā)的情況下基于在檢測到所述觸發(fā)之前收集的語音來控制所述預(yù)定功能的執(zhí)行。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于索尼公司,未經(jīng)索尼公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980038331.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





