[發(fā)明專利]一種數(shù)據(jù)分類方法及計算設(shè)備在審
| 申請?zhí)枺?/td> | 202011557715.9 | 申請日: | 2020-12-25 |
| 公開(公告)號: | CN112579819A | 公開(公告)日: | 2021-03-30 |
| 發(fā)明(設(shè)計)人: | 黃蕭;李林;徐丞申;劉榮 | 申請(專利權(quán))人: | 天津車之家數(shù)據(jù)信息技術(shù)有限公司 |
| 主分類號: | G06F16/65 | 分類號: | G06F16/65;G06F16/68;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京思睿峰知識產(chǎn)權(quán)代理有限公司 11396 | 代理人: | 孟玉潔;謝建云 |
| 地址: | 300467 天津市生態(tài)城動漫中路126號動漫*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù) 分類 方法 計算 設(shè)備 | ||
本發(fā)明公開了一種數(shù)據(jù)分類方法,在計算設(shè)備中執(zhí)行,包括:獲取待分類的數(shù)據(jù);將該數(shù)據(jù)輸入預(yù)設(shè)的多標(biāo)簽分類模型,以便多標(biāo)簽分類模型輸出該數(shù)據(jù)屬于每一個類別的概率,其中,多標(biāo)簽分類模型在訓(xùn)練時的損失函數(shù)適于提高目標(biāo)類別的分類準(zhǔn)確率;當(dāng)最大概率對應(yīng)的類別為目標(biāo)類別,且最大概率大于等于預(yù)設(shè)的概率閾值時,將目標(biāo)類別作為該數(shù)據(jù)所屬的類別。本發(fā)明一并公開了相應(yīng)的計算設(shè)備。
技術(shù)領(lǐng)域
本發(fā)明涉及音頻數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)分類方法及計算設(shè)備。
背景技術(shù)
近年來,人工智能技術(shù)飛速發(fā)展,已被應(yīng)用到多個領(lǐng)域。分類問題是人工智能算法中的一大類,應(yīng)用非常廣泛。在實際分類問題中,有時會碰到一種場景,即對特定類別的分類準(zhǔn)確率要求很高,而不關(guān)心其召回率以及其他類別的分類準(zhǔn)確率。例如,在智能外呼場景中,智能外呼機(jī)器人模擬真人向被叫用戶發(fā)起語音通話,進(jìn)行訪問、營銷等活動。根據(jù)智能外呼的語音通話情況,采用分類模型來將用戶分為明確有意向、可能有意向、明確無意向三類,對于明確有意向的用戶進(jìn)行人工電話回訪,以向這些用戶提供定制化的服務(wù)。在該場景中,智能外呼服務(wù)商更關(guān)心篩選出的明確有意向類別的準(zhǔn)確率,而不關(guān)心有沒有漏檢明確有意向的用戶以及可能有意向、明確無意向類別的準(zhǔn)確率。提高明確有意向類別的分類準(zhǔn)確率,可以減少不必要的人工電話量,從而提高服務(wù)效率。
現(xiàn)有的分類模型在分類準(zhǔn)確率上對所有類別一視同仁,無法滿足提高特定類別分類準(zhǔn)確率的需求。
發(fā)明內(nèi)容
為此,本發(fā)明提供一種數(shù)據(jù)分類方法及計算設(shè)備,以力圖解決或至少緩解上面存在的問題。
根據(jù)本發(fā)明的第一個方面,提供一種數(shù)據(jù)分類方法,在計算設(shè)備中執(zhí)行,包括:獲取待分類的數(shù)據(jù);將所述數(shù)據(jù)輸入預(yù)設(shè)的多標(biāo)簽分類模型,以便所述多標(biāo)簽分類模型輸出所述數(shù)據(jù)屬于每一個類別的概率,其中,所述多標(biāo)簽分類模型在訓(xùn)練時的損失函數(shù)適于提高目標(biāo)類別的分類準(zhǔn)確率;當(dāng)最大概率對應(yīng)的類別為所述目標(biāo)類別,且所述最大概率大于等于預(yù)設(shè)的概率閾值時,將目標(biāo)類別作為所述數(shù)據(jù)所屬的類別。
可選地,在根據(jù)本發(fā)明的數(shù)據(jù)分類方法中,損失函數(shù)適于對訓(xùn)練樣本的真實類別標(biāo)簽不是所述目標(biāo)類別,但所述多標(biāo)簽分類模型輸出的類別為所述目標(biāo)類別的情形進(jìn)行懲罰。
可選地,在根據(jù)本發(fā)明的數(shù)據(jù)分類方法中,多標(biāo)簽分類模型的損失函數(shù)為:
其中,C為類別的數(shù)量;yj用于表示訓(xùn)練樣本的真實類別標(biāo)簽是否為第j個類別,當(dāng)yj=1時,表示訓(xùn)練樣本的真實類別標(biāo)簽是第j個類別,當(dāng)yj=0時,表示訓(xùn)練樣本的真實類別標(biāo)簽不是第j個類別;pj為多標(biāo)簽分類模型輸出的訓(xùn)練樣本屬于第j個類別的概率;λj為第j個類別的權(quán)重,其中,所述目標(biāo)類別的權(quán)重大于其他類別的權(quán)重。
可選地,在根據(jù)本發(fā)明的數(shù)據(jù)分類方法中,多標(biāo)簽分類模型的最后一個處理層為激活層,所述激活層包括與類別數(shù)量相同的Sigmoid激活函數(shù),所述Sigmoid激活函數(shù)的輸出為所述數(shù)據(jù)屬于相應(yīng)類別的概率。
可選地,在根據(jù)本發(fā)明的數(shù)據(jù)分類方法中,當(dāng)最大概率對應(yīng)的類別為所述目標(biāo)類別,且所述最大概率小于所述概率閾值時,將除所述目標(biāo)類別之外概率最大的類別作為所述數(shù)據(jù)所屬的類別。
可選地,在根據(jù)本發(fā)明的數(shù)據(jù)分類方法中,當(dāng)最大概率對應(yīng)的類別不是所述目標(biāo)類別時,將最大概率對應(yīng)的類別作為所述數(shù)據(jù)所屬的類別。
可選地,在根據(jù)本發(fā)明的數(shù)據(jù)分類方法中,數(shù)據(jù)為語音通話音頻,所述類別包括:明確有意向、可能有意向、明確無意向,其中,明確有意向為所述目標(biāo)類別。
根據(jù)本發(fā)明的第二個方面,提供一種計算設(shè)備,包括:至少一個處理器;和存儲有程序指令的存儲器,當(dāng)所述程序指令被所述處理器讀取并執(zhí)行時,使得所述計算設(shè)備執(zhí)行上述數(shù)據(jù)分類方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津車之家數(shù)據(jù)信息技術(shù)有限公司,未經(jīng)天津車之家數(shù)據(jù)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011557715.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





