[發明專利]信息處理裝置、信息處理方法和程序在審
| 申請號: | 201780051273.0 | 申請日: | 2017-08-17 |
| 公開(公告)號: | CN109643551A | 公開(公告)日: | 2019-04-16 |
| 發明(設計)人: | 河野真一;滝祐平 | 申請(專利權)人: | 索尼公司 |
| 主分類號: | G10L15/30 | 分類號: | G10L15/30;G10L15/04;G10L15/22;G10L25/78 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 余剛 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音識別 語音識別結果 信息處理裝置 信息處理 語音識別系統 話語特征 網絡提供 語音信息 正常模式 語音 輸出 檢測 應用 | ||
1.一種信息處理裝置,包括:
話語特征檢測單元,獲取通過用戶的話語獲得的音頻信息,并從所述音頻信息檢測所述話語的特征;
特定無聲時段檢測單元,在檢測其中所述音頻信息包括音頻的話語部分的處理中,檢測作為未被確定為無聲時段的特定短無聲時段的特定無聲時段;
選擇單元,基于已經由所述話語特征檢測單元從所述音頻信息檢測到的所述話語的特征和已經由所述特定無聲時段檢測單元從所述音頻信息檢測到的所述特定無聲時段來選擇要對所述音頻信息執行的音頻識別處理;以及
輸出處理單元,將通過已經由所述選擇單元選擇的所述音頻識別處理而識別的音頻識別結果與音頻識別結果信息一起輸出,所述音頻識別結果信息指示已經獲得所述音頻識別結果的所述音頻識別處理。
2.根據權利要求1所述的信息處理裝置,其中,
所述選擇單元選擇用于識別正常字符串的正常模式的音頻識別處理或用于識別特殊字符串的特殊模式的音頻識別處理,來作為對所述音頻信息執行的所述音頻識別處理。
3.根據權利要求2所述的信息處理裝置,其中,
在確定已經由所述話語特征檢測單元從所述音頻信息中檢測到特定特征、并且確定已經由所述特定無聲時段檢測單元從所述音頻信息中以預定間隔重復檢測到所述特定無聲時段的情況下,所述選擇單元選擇所述特殊模式的所述音頻識別處理。
4.根據權利要求3所述的信息處理裝置,其中,
所述話語特征檢測單元將基于所述音頻信息的所述音頻的音量水平作為所述話語的特征來檢測,并且
在所述音頻的所述音量水平超過預設的預定音量水平的情況下,所述選擇單元確定已經從所述音頻信息中檢測到所述特定特征。
5.根據權利要求3所述的信息處理裝置,其中,
所述話語特征檢測單元將基于所述音頻信息的所述音頻的輸入速度作為所述話語的特征來檢測,并且
在已經發生其中由所述話語特征檢測單元檢測到的所述音頻的所述輸入速度變得相對慢的變化的情況下,所述選擇單元確定已經從所述音頻信息中檢測到所述特定特征。
6.根據權利要求3所述的信息處理裝置,其中,
所述話語特征檢測單元將基于所述音頻信息的所述音頻的頻率作為所述話語的特征來檢測,并且
在已經發生由所述話語特征檢測單元檢測的所述音頻的頻率變得相對高的變化的情況下,所述選擇單元確定已經從所述音頻信息中檢測到所述特定特征。
7.根據權利要求2所述的信息處理裝置,其中,
在所述特殊模式的所述音頻識別處理中,通過音頻識別所識別的單詞被轉換成數字并被輸出。
8.根據權利要求2所述的信息處理裝置,其中,
在所述特殊模式的所述音頻識別處理中,通過音頻識別所識別的字母被逐個字符地轉換成大寫字母并被輸出。
9.根據權利要求2所述的信息處理裝置,其中,
在所述特殊模式的所述音頻識別處理中,通過音頻識別所識別的每一字符被轉換成片假名并被輸出。
10.根據權利要求2所述的信息處理裝置,其中,
還包括噪聲檢測單元,所述噪聲檢測單元檢測包括在所述音頻信息中的噪聲的音量水平,
其中,在所述噪聲的所述音量水平超過預設的預定音量水平的情況下,所述選擇單元避免選擇所述特殊模式的所述音頻識別處理。
11.根據權利要求2所述的信息處理裝置,其中,
所述輸出處理單元在所述正常模式的所述音頻識別處理的音頻識別結果和所述特殊模式的所述音頻識別處理的音頻識別結果之間改變用戶界面的表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司,未經索尼公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780051273.0/1.html,轉載請聲明來源鉆瓜專利網。





