[發(fā)明專利]孿生網(wǎng)絡(luò)模型訓(xùn)練、度量方法、裝置、介質(zhì)和設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 202110113716.2 | 申請(qǐng)日: | 2021-01-27 |
| 公開(kāi)(公告)號(hào): | CN112784130B | 公開(kāi)(公告)日: | 2022-05-27 |
| 發(fā)明(設(shè)計(jì))人: | 李鵬;曹偲;潘頌聲;劉華平;趙翔宇;熊貝爾;陳夢(mèng);金強(qiáng);蔡苗苗;白楊 | 申請(qǐng)(專利權(quán))人: | 杭州網(wǎng)易云音樂(lè)科技有限公司 |
| 主分類號(hào): | G06F16/906 | 分類號(hào): | G06F16/906;G06F16/65;G06F16/9535;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 萬(wàn)曉君 |
| 地址: | 310052 浙江省杭州市蕭山區(qū)錢江世*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 孿生 網(wǎng)絡(luò) 模型 訓(xùn)練 度量 方法 裝置 介質(zhì) 設(shè)備 | ||
本公開(kāi)涉及一種孿生網(wǎng)絡(luò)模型訓(xùn)練、度量方法、裝置、介質(zhì)和設(shè)備。先預(yù)訓(xùn)練一個(gè)標(biāo)簽分類模型,然后利用訓(xùn)練出的標(biāo)簽分類模型,通過(guò)增加編碼神經(jīng)網(wǎng)絡(luò)分支的方式,構(gòu)造孿生網(wǎng)絡(luò)模型,從而可以基于包括標(biāo)簽分類學(xué)習(xí)和度量學(xué)習(xí)的多任務(wù)學(xué)習(xí)的方式,訓(xùn)練得到用于推薦系統(tǒng)中的數(shù)據(jù)相似度度量的孿生網(wǎng)絡(luò)模型。通過(guò)分階段訓(xùn)練以及多任務(wù)學(xué)習(xí)約束的方式,可以有效提高模型的穩(wěn)定性和泛化能力,并提高訓(xùn)練出的用于推薦系統(tǒng)中的數(shù)據(jù)相似度度量的孿生網(wǎng)絡(luò)模型的準(zhǔn)確性。進(jìn)一步的,可以基于訓(xùn)練出的孿生網(wǎng)絡(luò)模型進(jìn)行數(shù)據(jù)相似度度量,有效提高數(shù)據(jù)相似度度量的準(zhǔn)確性。將訓(xùn)練出的孿生網(wǎng)絡(luò)模型用于歌曲相似度度量,即可以有效提高歌曲相似度度量的準(zhǔn)確性。
技術(shù)領(lǐng)域
本公開(kāi)涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種孿生網(wǎng)絡(luò)模型訓(xùn)練、度量方法、裝置、介質(zhì)和設(shè)備。
背景技術(shù)
本部分旨在為權(quán)利要求書(shū)中陳述的本公開(kāi)的實(shí)施方式提供背景或上下文。此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。
推薦系統(tǒng)中的數(shù)據(jù)相似度度量具有廣泛的應(yīng)用價(jià)值,因此受到了極大的重視。進(jìn)行相似度度量的數(shù)據(jù)可以為任意類型,例如,可以為音頻(如音樂(lè))類型、或視頻類型或者文本類型(如新聞)等等。但是目前的數(shù)據(jù)相似度度量的準(zhǔn)確性仍然難以得到保證。
以進(jìn)行歌曲相似度度量為例,歌曲相似度度量對(duì)音樂(lè)分發(fā)、歌曲推薦、歌曲關(guān)聯(lián)、曲庫(kù)管理、音樂(lè)制作都有明顯的促進(jìn)作用。歌曲相似度度量可以從很多維度考慮,包括從歌手、歌詞、流派、用戶收聽(tīng)行為等維度進(jìn)行歌曲相似度度量。
例如,進(jìn)行歌曲相似度度量時(shí),可以認(rèn)為同一個(gè)歌手的作品可能具有較高的相似度;兩首歌的歌詞有數(shù)量較多的共有詞匯,則可能具有較高的相似度;同屬于搖滾流派的歌曲,在聽(tīng)感上可能比較相似,可能具有較高的相似度;兩首歌在眾多用戶的收藏中同時(shí)出現(xiàn),則可能有較高的相似度等等。
需要說(shuō)明的是,上述歌曲相似度度量維度并未從歌曲音頻內(nèi)容本身出發(fā),從音頻信號(hào)層面來(lái)考慮如何度量歌曲間的聽(tīng)感相似度,因此對(duì)歌曲的相似度度量不夠準(zhǔn)確。
一般來(lái)說(shuō),兩首歌曲聽(tīng)感上是否相似,與音頻信號(hào)本身的屬性密切相關(guān),例如使用的樂(lè)器類型、演唱者的音色、旋律、和弦和節(jié)奏等等。然而,在度量?jī)墒赘枨?tīng)感相似度時(shí),很難一一分析這些屬性進(jìn)行對(duì)比,即使能夠拆分成不同屬性,也比較難給出每個(gè)屬性上的相似度度量方法,以及最終的融合策略。因此,基于音頻內(nèi)容的歌曲相似度度量,一般是從音頻信號(hào)中抽取特征,建立機(jī)器學(xué)習(xí)模型,通過(guò)回歸、分類等方式來(lái)判斷兩首歌曲的相似度,或者直接基于相關(guān)性(correlation)計(jì)算,從特征中計(jì)算相關(guān)值,作為相似度打分。
但是目前相關(guān)技術(shù)基于音頻特征進(jìn)行歌曲相似度度量的準(zhǔn)確性仍然有待提高。
發(fā)明內(nèi)容
本公開(kāi)實(shí)施例提供一種孿生網(wǎng)絡(luò)模型訓(xùn)練、度量方法、裝置、介質(zhì)和設(shè)備,用于解決數(shù)據(jù)相似度度量的準(zhǔn)確性較低的問(wèn)題。
第一方面,本公開(kāi)提供了一種用于推薦系統(tǒng)中的數(shù)據(jù)相似度度量的孿生網(wǎng)絡(luò)模型訓(xùn)練方法,所述方法包括:
將第一樣本數(shù)據(jù)作為待訓(xùn)練標(biāo)簽分類模型的輸入,根據(jù)所述第一樣本數(shù)據(jù)的至少一個(gè)分類標(biāo)簽信息,訓(xùn)練得到已訓(xùn)練的標(biāo)簽分類模型,所述標(biāo)簽分類模型包括基礎(chǔ)神經(jīng)網(wǎng)絡(luò)和分類神經(jīng)網(wǎng)絡(luò),所述基礎(chǔ)神經(jīng)網(wǎng)絡(luò)用于將輸入的樣本數(shù)據(jù)轉(zhuǎn)換為設(shè)定維度的第一向量,所述分類神經(jīng)網(wǎng)絡(luò)用于根據(jù)所述基礎(chǔ)神經(jīng)網(wǎng)絡(luò)傳入的所述第一向量輸出所述至少一個(gè)標(biāo)簽類別下對(duì)應(yīng)的分類信息;
基于所述已訓(xùn)練的標(biāo)簽分類模型構(gòu)造孿生網(wǎng)絡(luò)模型,包括:在所述標(biāo)簽分類模型的基礎(chǔ)神經(jīng)網(wǎng)絡(luò)上,增加一個(gè)編碼神經(jīng)網(wǎng)絡(luò)分支,所述編碼神經(jīng)網(wǎng)絡(luò)用于根據(jù)所述基礎(chǔ)神經(jīng)網(wǎng)絡(luò)傳入的所述第一向量輸出指定維度的第二向量;
將第二樣本數(shù)據(jù)中的一對(duì)樣本數(shù)據(jù)作為待訓(xùn)練孿生網(wǎng)絡(luò)模型的輸入,所述一對(duì)樣本數(shù)據(jù)包括正樣本對(duì)或者負(fù)樣本對(duì),所述正樣本對(duì)包括一個(gè)樣本數(shù)據(jù)以及一個(gè)與該樣本數(shù)據(jù)相似的正樣本數(shù)據(jù),所述負(fù)樣本對(duì)包括一個(gè)樣本數(shù)據(jù)以及一個(gè)與該樣本數(shù)據(jù)不相似的負(fù)樣本數(shù)據(jù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州網(wǎng)易云音樂(lè)科技有限公司,未經(jīng)杭州網(wǎng)易云音樂(lè)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110113716.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種數(shù)控機(jī)床數(shù)字孿生建模方法
- 一種基于數(shù)字孿生模型的時(shí)序類潛在問(wèn)題識(shí)別方法及系統(tǒng)
- 一種礦井?dāng)?shù)字孿生模型及其構(gòu)建方法
- 一種以統(tǒng)一形式樣機(jī)模型定義數(shù)字孿生體的方法及裝置
- 基于數(shù)字孿生體的醫(yī)療設(shè)備定位方法、系統(tǒng)和存儲(chǔ)介質(zhì)
- 一種基于機(jī)器視覺(jué)的數(shù)字孿生模型修正方法與系統(tǒng)
- 一種基于數(shù)字孿生的泵機(jī)組優(yōu)化運(yùn)行調(diào)節(jié)系統(tǒng)及方法
- 數(shù)字孿生模型的運(yùn)行方法、裝置和電子設(shè)備
- 一種組件式孿生計(jì)算方法及系統(tǒng)
- 一種基于數(shù)字孿生的空間在軌激光加工過(guò)程實(shí)時(shí)監(jiān)測(cè)方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)





