[發明專利]一種識別方法、裝置、用于識別的裝置及語音合成方法在審
| 申請號: | 202110605363.8 | 申請日: | 2021-05-31 |
| 公開(公告)號: | CN113409766A | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 林國雯;周明;程龍;姜偉;曾可璇;段文君;劉愷;陳偉 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L13/047 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 方法 裝置 用于 語音 合成 | ||
本發明實施例提供了一種識別方法、裝置、用于識別的裝置以及語音合成方法。其中的識別方法包括:識別目標文本中的對話文本;根據當前對話文本的上下文,確定所述當前對話文本的候選說話人;獲取所述候選說話人與所述當前對話文本之間的關系特征;根據所述當前對話文本、所述當前對話文本的上下文、所述當前對話文本的候選說話人、以及所述關系特征,確定所述當前對話文本的至少一個目標說話人。本發明實施例可以自動識別目標文本中各對話文本的目標說話人,可以減少人工成本并且提高識別效率,還可以提高識別目標說話人的準確性。
技術領域
本發明涉及計算機技術領域,尤其涉及一種識別方法、裝置、用于識別的裝置以及語音合成方法。
背景技術
有聲文學作品受到越來越多的關注,對于多角色的文學作品,需要區分文學作品中各個對話所屬的角色,使得不同角色的演播人能夠快速準確地錄制自己的臺詞部分。
然而,目前通常通過人工通讀文學作品的方式識別文本作品中各個對話所屬的角色,不僅需要耗費大量的人力成本而且識別效率較低。
發明內容
本發明實施例提供一種識別方法、裝置、用于識別的裝置以及語音合成方法,可以自動識別目標文本中各對話文本的目標說話人,可以減少人工成本并且提高識別效率。
為了解決上述問題,本發明實施例公開了一種識別方法,所述方法包括:
識別目標文本中的對話文本;
根據當前對話文本的上下文,確定所述當前對話文本的候選說話人;
獲取所述候選說話人與所述當前對話文本之間的關系特征;
根據所述當前對話文本、所述當前對話文本的上下文、所述當前對話文本的候選說話人、以及所述關系特征,確定所述當前對話文本的至少一個目標說話人。
可選地,所述根據當前對話文本的上下文,確定所述當前對話文本的候選說話人,包括:
將所述當前對話文本的上下文逐句輸入識別模型,識別所述上下文中的指稱;
將識別的指稱作為所述當前對話文本的候選說話人。
可選地,所述方法還包括:
識別所述目標文本中的各指稱是否對應相同實體;
將對應相同實體的指稱進行共指消解,得到同一角色的所有對話文本。
可選地,所述方法還包括:
獲取所述目標文本中的目標對話文本以及所述目標對話文本的目標說話人;
根據所述目標對話文本的目標說話人的角色特征以及所述目標對話文本的對話場景特征,對所述目標對話文本進行語音合成,得到所述目標對話文本的語音合成數據。
可選地,所述根據所述當前對話文本、所述當前對話文本的上下文、所述當前對話文本的候選說話人、以及所述關系特征,確定所述當前對話文本的至少一個目標說話人,包括:
將所述當前對話文本、所述當前對話文本的上下文、所述當前對話文本的候選說話人、以及所述關系特征輸入預測模型,預測每個候選說話人為目標說話人的得分;
根據預測的每個候選說話人的得分,從所述候選說話人中確定所述當前對話文本的至少一個目標說話人。
可選地,所述將所述當前對話文本、所述當前對話文本的上下文、所述當前對話文本的候選說話人、以及所述關系特征輸入預測模型,預測每個候選說話人為目標說話人的得分,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110605363.8/2.html,轉載請聲明來源鉆瓜專利網。





