[發明專利]雙語詞典構建方法和設備有效
| 申請號: | 201710374136.2 | 申請日: | 2017-05-24 |
| 公開(公告)號: | CN107315741B | 公開(公告)日: | 2019-11-22 |
| 發明(設計)人: | 孫茂松;張檬;劉洋;欒煥博 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/27;G06N3/04;G06N3/08 |
| 代理公司: | 11002 北京路浩知識產權代理有限公司 | 代理人: | 王瑩<國際申請>=<國際公布>=<進入國 |
| 地址: | 100084 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 雙語 詞典 構建 方法 設備 | ||
1.雙語詞典構建方法,其特征在于,包括步驟:
S101、輸入語言a的單語語料A,和輸入語言b的單語語料B,分別將單語語料A和單語語料B中的詞表示為詞向量;
S102、訓練獲得單語語料A的詞向量與單語語料B的詞向量的映射關系;
S103、根據映射關系構建雙語詞典;
所述S102訓練獲得單語語料A的詞向量與單語語料B的詞向量的映射關系,包括:
S1021、初始化單隱層的前饋神經網絡作為鑒別器D,初始化線性映射G∈R^(d×d)作為生成器;
S1022、使用下列鑒別器的損失函數LD和生成器的損失函數LG訓練生成器G和鑒別器D,直至損失函數LG達到最小值時,獲得線性映射G;
其中,代表語言a的詞向量,代表語言b的詞向量,E代表期望,E的下標代表對相應的變量服從的分布計算期望,d為預設值;
其中,λ為超參數,cos代表余弦相似度。
2.根據權利要求1所述的方法,其特征在于,所述鑒別器D的輸入和隱層的輸出乘上高斯噪聲N(1,σ^2)。
3.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1至2任一所述方法的步驟。
4.一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上執行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1至2任一所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710374136.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種輔助寫作系統及方法
- 下一篇:一種基于適配器的大數據轉換方法及系統





