[發明專利]模型訓練方法及系統、通話音頻的預測方法及系統在審
| 申請號: | 202210293895.7 | 申請日: | 2022-03-23 |
| 公開(公告)號: | CN114565062A | 公開(公告)日: | 2022-05-31 |
| 發明(設計)人: | 張威;羅超;鄒宇;郝竹林;張啟祥;楊赫;陳文浩;張澤 | 申請(專利權)人: | 攜程旅游信息技術(上海)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06Q10/04 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 林嵩;馬濤 |
| 地址: | 201203 上海市浦東新*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 系統 通話 音頻 預測 | ||
1.一種模型訓練方法,其特征在于,所述模型訓練方法包括以下步驟:
獲取通話音頻,所述通話音頻包括第一通話音頻和第二通話音頻,所述第一通話音頻為通話過程中有旁邊人說話的音頻,所述第二通話音頻為通話過程中無旁邊人說話的音頻;
對所述通話音頻進行標注后形成訓練數據集;
將所述訓練數據集中的訓練數據輸入深度卷積神經網絡模型進行訓練以得到旁邊人說話檢測模型,所述旁邊人說話檢測模型用于預測通話過程中旁邊人說話的概率。
2.如權利要求1所述的模型訓練方法,其特征在于,所述對所述通話音頻進行標注后形成訓練數據集的步驟包括:
通過動態區域切割算法將所述通話音頻劃分為音頻時長都相同的音頻片段;
對所述音頻片段進行標注后形成所述訓練數據集。
3.如權利要求1所述的模型訓練方法,其特征在于,所述深度卷積神經網絡模型包括卷積層、池化層和線性層;
所述卷積層和所述池化層用于提取所述通話音頻的語音特征;
所述線性層用于根據所述卷積層和所述池化層輸出的所述語音特征對所述通話音頻進行分類,以確定所述通話音頻為所述第一通話音頻或所述通話音頻為所述第二通話音頻。
4.一種通話音頻的預測方法,其特征在于,所述預測方法用于預測通話過程中是否有旁邊人說話,所述預測方法包括以下步驟:
獲取待預測的通話音頻;
將所述待預測的通話音頻輸入旁邊人說話模型以預測所述待預測的通話音頻中有旁邊人說話的概率;
所述旁邊人說話模型通過如權利要求1-3任意一項所述的模型訓練方法訓練得到的。
5.如權利要求4所述的通話音頻的預測方法,其特征在于,所述將所述待預測的通話音頻輸入旁邊人說話模型以預測所述待預測的通話音頻中有旁邊人說話的概率的步驟包括:
基于所述旁邊人說話模型通過動態區域切割算法將所述待預測的通話音頻劃分為音頻時長都相同的音頻片段;
基于所述旁邊人說話模型通過softmax函數計算得到所述音頻片段中有旁邊人說話的概率,并通過所述旁邊人說話模型輸出所述音頻片段中有旁邊人說話的概率。
6.如權利要求5所述的通話音頻的預測方法,其特征在于,所述將所述待預測的通話音頻輸入旁邊人說話模型以預測所述待預測的通話音頻中有旁邊人說話的概率的步驟之后,所述預測方法包括:
基于所述音頻片段中與旁邊人說話的概率根據加權公式進行加權計算以得到與多個所述音頻片段對應的同一個所述待預測的通話音頻中有旁邊人說話的概率;
所述加權公式為:
其中,P(X)表示為所述待預測的通話音頻中有旁邊人說話的概率,n表示所述音頻片段的總數,p(x)表示為第x個所述音頻片段中有旁邊人說話的概率,x為正整數,a、b為常數。
7.一種模型訓練系統,其特征在于,所述模型訓練系統包括:
獲取模塊,用于獲取通話音頻,所述通話音頻包括第一通話音頻和第二通話音頻,所述第一通話音頻為通話過程中有旁邊人說話的音頻,所述第二通話音頻為通話過程中無旁邊人說話的音頻;
處理模塊,用于對所述通話音頻進行標注后形成訓練數據集;
訓練模塊,用于將所述訓練數據集中的訓練數據輸入深度卷積神經網絡模型進行訓練以得到旁邊人說話檢測模型,所述旁邊人說話檢測模型用于預測通話過程中旁邊人說話的概率。
8.一種通話音頻的預測系統,其特征在于,所述預測系統包括:
音頻獲取模塊,用于獲取待預測的通話音頻;
預測模塊,用于將所述待預測的通話音頻輸入旁邊人說話模型以預測所述待預測的通話音頻中有旁邊人說話的概率;
所述旁邊人說話模型通過如權利要求7所述的模型訓練系統訓練得到的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程旅游信息技術(上海)有限公司,未經攜程旅游信息技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210293895.7/1.html,轉載請聲明來源鉆瓜專利網。





