[發(fā)明專(zhuān)利]詞向量訓(xùn)練方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710022458.0 | 申請(qǐng)日: | 2017-01-12 |
| 公開(kāi)(公告)號(hào): | CN106897265B | 公開(kāi)(公告)日: | 2020-07-10 |
| 發(fā)明(設(shè)計(jì))人: | 李建欣;劉垚鵬;彭浩;張日崇;陳漢騰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京航空航天大學(xué) |
| 主分類(lèi)號(hào): | G06F40/284 | 分類(lèi)號(hào): | G06F40/284;G06F40/242;G06F16/23 |
| 代理公司: | 北京同立鈞成知識(shí)產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 楊澤;劉芳 |
| 地址: | 100191 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 向量 訓(xùn)練 方法 裝置 | ||
1.一種詞向量訓(xùn)練方法,其特征在于,包括:
獲取新增詞匯庫(kù),所述新增詞匯庫(kù)中的詞匯與舊詞匯庫(kù)中的詞匯構(gòu)成新詞匯庫(kù),所述舊詞匯庫(kù)中的詞匯對(duì)應(yīng)有舊詞向量;
對(duì)所述新詞匯庫(kù)中的詞匯進(jìn)行初始化處理,使得所述新詞匯庫(kù)中屬于所述舊詞匯庫(kù)中的詞匯的詞向量為舊詞向量,所述新詞匯庫(kù)中屬于所述新增詞匯庫(kù)中的詞匯詞向量為隨機(jī)詞向量;
根據(jù)所述新詞匯庫(kù)對(duì)應(yīng)的第一哈夫曼樹(shù)和所述舊詞匯庫(kù)對(duì)應(yīng)的第二哈夫曼樹(shù)分別對(duì)所述新詞匯庫(kù)中詞匯的詞向量進(jìn)行更新;
其中,所述根據(jù)所述新詞匯庫(kù)對(duì)應(yīng)的第一哈夫曼樹(shù)和所述舊詞匯庫(kù)對(duì)應(yīng)的第二哈夫曼樹(shù)分別對(duì)所述新詞匯庫(kù)中詞匯的詞向量進(jìn)行更新,包括:
獲取第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù),所述第一詞匯為所述新詞匯庫(kù)中的詞匯;
根據(jù)所述第一詞匯在所述第一哈夫曼樹(shù)的屬性和在所述第二哈夫曼樹(shù)的屬性對(duì)所述預(yù)設(shè)目標(biāo)函數(shù)進(jìn)行梯度處理,得到所述第一詞匯對(duì)應(yīng)的詞向量;
其中,所述獲取第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù),包括:
若所述第一詞匯屬于所述舊詞匯庫(kù),則根據(jù)Skip-gram模型的原始目標(biāo)函數(shù)對(duì)所述第一詞匯進(jìn)行因式分解,得到所述第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù);
若所述第一詞匯屬于所述新增詞匯庫(kù),則所述第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù)為所述Skip-gram模型的原始目標(biāo)函數(shù);
或者,所述獲取第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù),包括:
若所述第一詞匯屬于所述舊詞匯庫(kù),則根據(jù)CBOW模型的原始目標(biāo)函數(shù)對(duì)所述第一詞匯進(jìn)行因式分解,得到所述第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù);
若所述第一詞匯屬于所述新增詞匯庫(kù),則所述第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù)為所述CBOW模型的原始目標(biāo)函數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù),包括:
若所述第一詞匯屬于所述舊詞匯庫(kù),則根據(jù)對(duì)所述第一詞匯進(jìn)行因式分解,得到所述第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù);
若所述第一詞匯屬于所述新增詞匯庫(kù),則所述第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù)為Skip-gram模型的原始目標(biāo)函數(shù)
其中,w表示所述第一詞匯,W表示所述舊詞匯庫(kù),ΔW表示所述新增詞匯庫(kù),C(w)表示w上下文對(duì)應(yīng)的詞匯構(gòu)成的詞匯庫(kù),u表示w上下文對(duì)應(yīng)的詞匯,代表w為非葉子節(jié)點(diǎn)時(shí),在第二哈夫曼樹(shù)和在第一哈夫曼樹(shù)上匹配的哈夫曼編碼的長(zhǎng)度,j表示所述第一詞匯為所述第二哈夫曼樹(shù)上的第j個(gè)節(jié)點(diǎn),表示u對(duì)應(yīng)的第一哈夫曼路徑上第j-1個(gè)節(jié)點(diǎn)的詞向量,表示u代表的第二哈夫曼路徑上第j個(gè)節(jié)點(diǎn)的哈夫曼編碼,表示激活函數(shù),v(w)表示w對(duì)應(yīng)的詞向量;L′u表示詞匯u在第一哈夫曼樹(shù)上的編碼長(zhǎng)度。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù),包括:
若所述第一詞匯屬于所述舊詞匯庫(kù),則根據(jù)
對(duì)所述第一詞匯進(jìn)行因式分解,得到所述第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù);
若所述第一詞匯屬于所述新增詞匯庫(kù),則所述第一詞匯對(duì)應(yīng)的預(yù)設(shè)目標(biāo)函數(shù)為CBOW模型的原始目標(biāo)函數(shù);
其中,表示w代表的第二哈夫曼路徑上第i個(gè)節(jié)點(diǎn)的哈夫曼編碼,表示C(w)中所有詞匯對(duì)應(yīng)的詞向量相加之和;
w表示所述第一詞匯,W表示所述舊詞匯庫(kù),ΔW表示所述新增詞匯庫(kù),C(w)表示w上下文對(duì)應(yīng)的詞匯構(gòu)成的詞匯庫(kù),代表w為非葉子節(jié)點(diǎn)時(shí)在第二哈夫曼樹(shù)和在第一哈夫曼樹(shù)上匹配的哈夫曼編碼的長(zhǎng)度;i表示所述第一詞匯為所述第二哈夫曼樹(shù)上的第i個(gè)節(jié)點(diǎn),表示w對(duì)應(yīng)的第一哈夫曼路徑上第i-1個(gè)節(jié)點(diǎn)的詞向量,L'w表示第一詞匯w在第一哈夫曼樹(shù)上的編碼長(zhǎng)度,表示激活函數(shù)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京航空航天大學(xué),未經(jīng)北京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710022458.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 移動(dòng)向量解碼方法和移動(dòng)向量解碼裝置
- 一種用于支持向量機(jī)的在線(xiàn)向量選取方法
- 用于在幀序列中執(zhí)行運(yùn)動(dòng)估計(jì)的數(shù)據(jù)處理系統(tǒng)和方法
- 神經(jīng)網(wǎng)絡(luò)的處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 字符序列處理方法及設(shè)備
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 近鄰向量的召回方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種向量運(yùn)算裝置及運(yùn)算方法
- 生成類(lèi)別向量的方法和裝置
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





