[發明專利]詞嵌入模型的訓練方法及裝置有效

申請號：	201811083305.8	申請日：	2018-09-17
公開（公告）號：	CN109308354B	公開（公告）日：	2019-08-27
發明（設計）人：	李健銓;劉小康;陳瑋	申請（專利權）人：	北京神州泰岳軟件股份有限公司
主分類號：	G06F17/27	分類號：	G06F17/27
代理公司：	北京弘權知識產權代理事務所(普通合伙) 11363	代理人：	逯長明;許偉群
地址：	100089 北京市海淀區***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	近義詞嵌入目標詞輸入詞矩陣向量獲取目標訓練樣本詞向量嵌入的向量化預測地被紊亂更新移動申請
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種詞嵌入模型的訓練方法，其特征在于，包括以下步驟：

利用詞嵌入矩陣，將訓練樣本的輸入詞向量化表示為第一向量；

根據所述第一向量得到預測詞；

利用所述預測詞，以及所述輸入詞所對應的真實詞，更新所述輸入詞在詞嵌入矩陣中所對應的參數；

獲取目標詞的近義詞集，所述目標詞包括所述輸入詞或所述真實詞；

更新所述近義詞集中的至少一個近義詞在詞嵌入矩陣中對應的參數，以縮短所述至少一個近義詞與所述目標詞之間的距離；其中，所述至少一個近義詞中包括至少一個遠距離近義詞，所述遠距離近義詞與所述目標詞之間的距離大于或等于所述目標詞的至少一個反義詞與所述目標詞之間的距離。

2.根據權利要求1所述的詞嵌入模型的訓練方法，其特征在于，所述詞嵌入模型的目標函數為：

L(H)＝L+α·J(w_t,w_syn)，

其中，L為第一目標函數，表示CBOW模型或Skip-gram模型的目標函數；

w_t表示目標詞，w_syn表示目標詞的近義詞集；

J(w_t,w_syn)為第二目標函數，表示所述至少一個近義詞與所述目標詞之間的距離；

α表示影響因子。

3.根據權利要求2所述的詞嵌入模型的訓練方法，其特征在于，

其中，w_t表示目標詞，w_i表示所述至少一個近義詞中的一個近義詞；

J(w_t,w_i)表示所述至少一個近義詞中的一個近義詞w_i與目標詞w_t之間的距離。

4.根據權利要求3所述的詞嵌入模型的訓練方法，其特征在于，更新所述近義詞集中的至少一個近義詞在詞嵌入矩陣中對應的參數的步驟，包括：

w_ij^(new)＝w_ij+η·Gradient(w_ij)，

其中，w_ij^(new)表示近義詞w_i的第j維在更新后的值；

η表示第二學習率；

Gradient(w_ij)表示近義詞w_i的第j維的更新梯度；

表示目標詞w_t與近義詞w_i之間的距離值，對w_i的第j維的偏導數；

w_ij表示近義詞w_i的第j維在更新之前的值；

w_tj表示目標詞的第j維的值。

5.根據權利要求4所述的詞嵌入模型的訓練方法，其特征在于，第二學習率η通過以下方式得到：

η＝α·μ，

其中，α表示影響因子；

μ表示第一學習率；

μ₀表示第一學習率預設初始值；

train_words表示訓練語料的總詞數；

word_ca表示當前已經訓練過的輸入詞的數量；

iter表示當前訓練的迭代輪次。

6.根據權利要求4所述的詞嵌入模型的訓練方法，其特征在于，當更新梯度Gradient(w_ij)的絕對值＞max_Gradient時，取所述Gradient(w_ij)＝max_Gradient；

其中，max_Gradient為梯度最大值；

starting_mG表示梯度最大值的預設初始值；

train_words表示訓練語料的總詞數；

word_ca表示當前已經訓練過的輸入詞的數量；

iter表示當前訓練的迭代輪次。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京神州泰岳軟件股份有限公司，未經北京神州泰岳軟件股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811083305.8/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理
G06F17-00 特別適用于特定功能的數字計算設備或數據處理設備或數據處理方法
G06F17-10 .復雜數學運算的
G06F17-20 .處理自然語言數據的
G06F17-30 .信息檢索；及其數據庫結構
G06F17-40 .數據的獲取和記錄
G06F17-50 .計算機輔助設計

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】