[發明專利]詞向量獲取模型生成方法、裝置及詞向量獲取方法、裝置在審
| 申請號: | 202010096669.0 | 申請日: | 2020-02-17 |
| 公開(公告)號: | CN111310464A | 公開(公告)日: | 2020-06-19 |
| 發明(設計)人: | 于皓;張杰;李犇;羅華剛;袁杰;鄧禮志 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 王康;龍洪 |
| 地址: | 100084 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 向量 獲取 模型 生成 方法 裝置 | ||
1.一種詞向量獲取模型生成方法,其特征在于,包括:
獲取樣本語料文本;
將所述樣本語料文本作為輸入訓練預先構建的生成對抗網絡模型,得到用于獲取詞向量的詞向量獲取模型;其中,所述生成對抗網絡模型包括:利用周圍詞預測中心詞的第一詞向量預測模型和利用中心詞預測周圍詞的第二詞向量預測模型。
2.根據權利要求1所述的方法,其特征在于,所述將樣本語料文本作為輸入訓練預先構建的生成對抗網絡模型,得到用于獲取詞向量的詞向量獲取模型,包括:
基于所述樣本語料文本,并分別利用所述第一詞向量預測模型和所述第二詞向量預測模型進行詞向量預測,得到第一詞向量集合和第二詞向量集合;
計算相同詞在所述第一詞向量集合和所述第二詞向量集合中對應的詞向量之間的相似度;
基于所述第一詞向量集合、所述第二詞向量集合和計算得到的相似度訓練所述生成對抗網絡模型,得到所述詞向量獲取模型。
3.根據權利要求2所述的方法,其特征在于,所述基于第一詞向量集合、第二詞向量集合和計算得到的相似度訓練生成對抗網絡模型,得到詞向量獲取模型,包括:
基于所述第一詞向量集合、所述第二詞向量集合和計算得到的相似度,根據預先設定的損失函數,利用梯度下降算法對所述生成對抗網絡模型進行迭代訓練、調整所述生成對抗網絡模型中的參數,直到所述損失函數的損失值收斂,得到所述詞向量獲取模型。
4.根據權利要求2所述的方法,其特征在于,所述基于樣本語料文本,并分別利用第一詞向量預測模型和第二詞向量預測模型進行詞向量預測,得到第一詞向量集合和第二詞向量集合,包括:
利用所述第一詞向量預測模型,并基于所述樣本語料文本的周圍詞預測中心詞的詞向量,并將預測得到的中心詞的詞向量與所基于的周圍詞的詞向量進行拼接,以得到第一詞向量集合;
利用所述第二詞向量預測模型,并基于所述樣本語料文本的中心詞預測周圍詞的詞向量,并將預測得到的周圍詞的詞向量與所基于的中心詞的詞向量進行拼接,以得到第二詞向量集合。
5.根據權利要求4所述的方法,其特征在于,組成所述中心詞的字個數為第一預設個數;所述周圍詞包括:位于所述中心詞前的第一部分周圍詞和位于所述中心詞后的第二部分周圍詞,其中,組成所述第一部分周圍詞的字個數為第二預設個數,組成所述第二部分周圍詞的字個數為第三預設個數。
6.一種詞向量獲取方法,其特征在于,包括:
獲取待處理語料文本;
將所述待處理語料文本輸入至如權利要求1-5任一項所述的詞向量獲取模型生成方法生成的詞向量獲取模型中,以得到所述待處理語料文本的詞向量。
7.根據權利要求6所述的方法,其特征在于,所述將待處理語料文本輸入至如權利要求1-5任一項的詞向量獲取模型生成方法生成的詞向量獲取模型中,以得到待處理語料文本的詞向量,包括:
獲取所述待處理語料樣本的周圍詞的詞向量;
將獲得的周圍詞的詞向量輸入至如權利要求1-5任一項所述的詞向量獲取模型生成方法生成的詞向量獲取模型的第一詞向量預測模型中,得到中心詞的詞向量;
基于獲得的中心詞的詞向量得到所述待處理語料文本的詞向量。
8.根據權利要求6所述的方法,其特征在于,所述將待處理語料文本輸入至如權利要求1-5任一項的詞向量獲取模型生成方法生成的詞向量獲取模型中,以得到待處理語料文本的詞向量,包括:
獲取所述待處理語料樣本的中心詞的詞向量;
將獲得的中心詞的詞向量輸入至如權利要求1-5任一項所述的詞向量獲取模型生成方法生成的詞向量獲取模型的第二詞向量預測模型中,得到周圍詞的詞向量;
基于獲得的周圍詞的詞向量得到所述待處理語料文本的詞向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010096669.0/1.html,轉載請聲明來源鉆瓜專利網。





