[發明專利]語音處理裝置、語音處理方法和程序有效
| 申請號: | 201010254757.5 | 申請日: | 2010-08-13 |
| 公開(公告)號: | CN101996627A | 公開(公告)日: | 2011-03-30 |
| 發明(設計)人: | 池田哲男;宮下健;梨子田辰志 | 申請(專利權)人: | 索尼公司 |
| 主分類號: | G10L13/00 | 分類號: | G10L13/00;G10L13/04;G10L13/08;G06F17/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 康建峰;陳煒 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 裝置 方法 程序 | ||
技術領域
本發明涉及語音處理裝置、語音處理方法和程序。
背景技術
近年來,越來越多的用戶將數字化音樂數據存儲到個人計算機(PC)和便攜式音頻播放器中并通過根據存儲的音樂數據播放音樂來欣賞。基于具有表列音樂數據的播放列表按順序執行這種音樂播放。當總是單純地按同樣的次序播放音樂時,可能用戶不久就會厭煩音樂播放。因此,用于音頻播放器的一些軟件具有按從播放列表中隨機選擇的次序執行音樂播放的功能。
日本專利申請公開No.10-104010中公開了一種自動識別音樂的間歇期并在間歇期以語音的形式輸出導航信息的導航裝置。除了單純地播放音樂之外,導航裝置可以在用戶欣賞其播放的音樂與其它音樂之間的間歇期向用戶提供有用的信息。
發明內容
日本專利申請公開No.10-104010中公開的導航裝置主要目的是插入導航信息而不覆蓋音樂播放,并非旨在改變欣賞音樂的用戶的體驗質量。如果可以不僅在間歇期而且在音樂進行中的各個時間點輸出多樣化的語音,則可以針對娛樂性和真實感改進用戶的體驗質量。
鑒于上述內容,期望提供一種新型的和改進的語音處理裝置、語音處理方法和程序,能夠在音樂進行中的各個時間點輸出多樣化的語音。
根據本發明的一個實施例,提供了一種語音處理裝置,包括:數據獲取單元,用于獲取定義音樂進行中一個或更多個時間點或者一個或更多個時間段的特性的音樂進行數據;確定單元,用于通過采用數據獲取單元獲取的音樂進行數據確定要在播放音樂期間輸出語音的輸出時間點;以及音頻輸出單元,用于在播放音樂期間在確定單元確定的輸出時間點輸出語音。
采用以上配置,動態地確定與音樂進行中一個或更多個時間點或者一個或更多個時間段相關聯的輸出時間點,并且在音樂播放期間在輸出時間點輸出語音。
數據獲取單元還可以獲取用于定義與特性由音樂進行數據定義的一個或更多個時間點或者一個或更多個時間段中的任何一個相關聯的語音輸出時刻的時刻數據,以及,確定單元可以通過采用音樂進行數據和時刻數據確定輸出時間點。
數據獲取單元還可以獲取定義語音內容的模板,以及,語音處理裝置還可以包括:合成單元,用于通過采用數據獲取單元獲取的模板合成語音。
模板可以包含以文本格式描述語音內容的文本數據,并且文本數據可以具有表示要插入音樂的屬性值的位置的特定符號。
數據獲取單元還可以獲取表示音樂的屬性值的屬性數據,并且合成單元可以在根據數據獲取單元獲取的屬性數據在特定符號所表示的位置插入音樂的屬性值之后通過采用模板中包含的文本數據合成語音。
語音處理裝置還可以包括:存儲器單元,用于存儲被定義為分別與音樂播放相關的多個主題中的任何一個主題相關聯的多個模板,其中,數據獲取單元可以從存儲器單元處存儲的多個模板中獲取與指定主題對應的一個或更多個模板。
至少一個模板可以包含被插入音樂的標題或藝術家姓名作為屬性值的文本數據。
至少一個模板可以包含被插入與音樂的排名相關的屬性值的文本數據。
語音處理裝置還可以包括:歷史日志單元,用于記錄音樂播放的歷史,其中至少一個模板可以包含被插入基于歷史日志單元記錄的歷史設置的屬性值的文本數據。
至少一個模板可以包含被插入基于音樂收聽者或者與收聽者不同的用戶的音樂播放歷史設置的屬性值的文本數據。
音樂進行數據定義的一個或更多個時間點或者一個或更多個時間段的特性可以包含在該時間點或時間段處演唱的存在、旋律的類型、節拍的存在、音符的類型、音調的類型以及演奏的樂器的類型中的至少一個。
根據本發明的另一個實施例,提供了一種采用語音處理裝置的語音處理方法,包括如下步驟:從布置在語音處理裝置內部或外部的存儲介質獲取定義音樂進行中一個或更多個時間點或者一個或更多個時間段的特性的音樂進行數據;通過采用獲取的音樂進行數據確定要在播放音樂期間輸出語音的輸出時間點;并且在播放音樂期間在確定的輸出時間點輸出語音。
根據本發明的另一個實施例,提供了一種程序,用于使控制語音處理裝置的計算機用作:數據獲取單元,用于獲取定義音樂進行中一個或更多個時間點或者一個或更多個時間段的特性的音樂進行數據;確定單元,用于通過采用數據獲取單元獲取的音樂進行數據確定要在播放音樂期間輸出語音的輸出時間點;以及音頻輸出單元,用于在播放音樂期間在確定單元確定的輸出時間點輸出語音。
如上所述,采用根據本發明的語音處理裝置、語音處理方法和程序,可以在音樂進行中的各個時間點輸出多樣化的語音。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司,未經索尼公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010254757.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:旋轉小丑
- 下一篇:圖像解析方法以及圖像解析裝置





