[發明專利]發音者檢索裝置、發音者檢索方法以及發音者檢索程序有效
| 申請號: | 201780088429.2 | 申請日: | 2017-09-25 |
| 公開(公告)號: | CN110431546B | 公開(公告)日: | 2023-10-13 |
| 發明(設計)人: | 森纮一郎;鈴木優;大谷大和;森田真弘 | 申請(專利權)人: | 株式會社東芝;東芝數字解決方案株式會社 |
| 主分類號: | G06F16/63 | 分類號: | G06F16/63;G06F16/683 |
| 代理公司: | 永新專利商標代理有限公司 72002 | 代理人: | 楊謙 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 發音 檢索 裝置 方法 以及 程序 | ||
1.一種發音者檢索裝置,其中,具備:
第一變換部,使用用于將表示聲質特征的得分向量變換成聲學模型的第一變換模型的逆變換模型,將預先登記的所述聲學模型變換成所述得分向量,并與發音者識別信息建立對應地登記在得分管理信息中;
受理部,受理所述得分向量的輸入;以及
檢索部,從所述得分管理信息中檢索與受理的所述得分向量相似的發音者識別信息。
2.根據權利要求1所述的發音者檢索裝置,其中,
所述得分向量表示發音者的聲質的主觀特征。
3.根據權利要求1所述的發音者檢索裝置,其中,具備:
第二變換部,使用所述第一變換模型,將受理的所述得分向量變換成所述聲學模型;以及
再現部,對從所述聲學模型合成的語音進行再現。
4.根據權利要求1所述的發音者檢索裝置,其中,
所述聲學模型是將從語音的語言特征量到語音的聲音特征量的映射統計性地模型化而成的。
5.根據權利要求4所述的發音者檢索裝置,其中,
具備第三變換部,該第三變換部使用用于將所述聲音特征量變換成所述得分向量的第三變換模型,將發音者的所述聲音特征量變換成所述得分向量,并登記在所述得分管理信息中。
6.根據權利要求5所述的發音者檢索裝置,其中,
具備第三學習部,該第三學習部學習用于將所述聲音特征量變換成所述得分向量的所述第三變換模型。
7.根據權利要求1所述的發音者檢索裝置,其中,
所述得分向量按照聲質的特征的每個種類用得分表示聲質特征的主觀強度,
所述受理部受理示出所述特征的每個種類的得分的所述得分向量和針對所述特征的種類的加權值,
所述檢索部檢索與將受理的所述得分向量中包含的所述得分利用對應的加權值進行加權后得到的所述得分向量相似的發音者識別信息。
8.一種發音者檢索方法,其中,包括:
使用用于將表示聲質特征的得分向量變換成聲學模型的第一變換模型的逆變換模型,將預先登記的所述聲學模型變換成所述得分向量,并與發音者識別信息建立對應地登記在得分管理信息中的步驟;
受理所述得分向量的輸入的步驟;以及
從所述得分管理信息中檢索與受理的所述得分向量相似的發音者識別信息的步驟。
9.一種發音者檢索程序,其中,用于使計算機執行下述步驟:
使用用于將表示聲質特征的得分向量變換成聲學模型的第一變換模型的逆變換模型,將預先登記的所述聲學模型變換成所述得分向量,并與發音者識別信息建立對應地登記在得分管理信息中的步驟;
受理所述得分向量的輸入的步驟;以及
從所述得分管理信息中檢索與受理的所述得分向量相似的發音者識別信息的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝;東芝數字解決方案株式會社,未經株式會社東芝;東芝數字解決方案株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780088429.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:針對結構化數據和非結構化數據執行查詢
- 下一篇:電子設備和控制方法





