[發(fā)明專利]一種跨語言詞嵌入的方法、移動終端和計算機存儲介質在審
| 申請?zhí)枺?/td> | 202011175684.0 | 申請日: | 2020-10-28 |
| 公開(公告)號: | CN112287692A | 公開(公告)日: | 2021-01-29 |
| 發(fā)明(設計)人: | 唐麗萍;羅智泉 | 申請(專利權)人: | 香港中文大學(深圳) |
| 主分類號: | G06F40/42 | 分類號: | G06F40/42;G06F40/242;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市深聯(lián)知識產權代理事務所(普通合伙) 44357 | 代理人: | 黃立強 |
| 地址: | 518000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語言 嵌入 方法 移動 終端 計算機 存儲 介質 | ||
1.一種跨語言詞嵌入的方法,其特征在于,所述方法包括:
將目標語言和源語言分別嵌入單語言詞嵌入模型學習目標語言的第一詞嵌入表征和源語言的第二詞嵌入表征;
基于中間域采用對抗訓練學習所述目標語言和所述源語言之間的線性映射;
根據自我學習的方法對所述線性映射進行微調。
2.根據權利要求1所述的方法,其特征在于,基于中間域采用對抗訓練學習所述目標語言和所述源語言之間的線性映射的步驟包括:
基于循環(huán)生成對抗網絡自動編碼器的框架,將源語言空間和目標語言空間變換到源語言隱空間和目標語言隱空間;
所述循環(huán)生成對抗網絡自動編碼器中的生成器將所述源語言隱空間和所述目標語言隱空間的兩個向量映射到中間語言空間,所述中間語言空間關聯(lián)所述中間域;
所述循環(huán)生成對抗網絡自動編碼器中的判別器判別給定兩個所述向量的來源,以實現(xiàn)對抗訓練。
3.根據權利要求2所述的方法,其特征在于,所述循環(huán)生成對抗網絡自動編碼器中的生成器將所述源語言隱空間和所述目標語言隱空間的兩個向量映射到中間語言空間,所述中間語言空間關聯(lián)所述中間域的步驟包括:
預設域變量的概率密度函數;
設定生成器模型,所述循環(huán)生成對抗網絡自動編碼器包括第一生成器和第二生成器,所述第一生成器將所述源語言隱空間的第一向量映射到所述中間語言空間;
所述第二生成器將所述目標語言隱空間的第二向量映射到所述中間語言空間。
4.根據權利要求3所述的方法,其特征在于,所述循環(huán)生成對抗網絡自動編碼器中的生成器將所述源語言隱空間和所述目標語言隱空間的兩個向量映射到中間語言空間,所述中間語言空間關聯(lián)所述中間域的步驟還包括:
所述第一生成器和所述第二生成器均關聯(lián)所述域變量,設定生成器模型,根據線性插值法和所述域變量將所述中間域生成為源域及目標域的線性組合。
5.根據權利要求4所述的方法,其特征在于,根據自我學習的方法對所述線性映射進行微調的步驟包括:
使用所述概率密度函數對所述域變量進行采樣,利用目標函數進行反向傳播;
更新所述循環(huán)生成對抗網絡自動編碼器中的兩個判別器和兩個生成器;
對所述生成器進行近似正交化后處理,求解當前詞典下的最優(yōu)線性變換得到學習結果,實現(xiàn)詞迭代收斂;
根據自我學習時間表對所述學習結果進行微調。
6.根據權利要求5所述的方法,其特征在于,根據自我學習時間表對所述學習結果進行微調的步驟包括:
求解正交限制條件下的最小二乘法問題得到所述當前詞典下的所述最優(yōu)線性變換;
基于所述最優(yōu)線性變換將所述源語言隱空間和所述目標語言隱空間的單詞映射到所述中間語言空間;
尋找每個所述單詞最近的詞作為對應的翻譯來更新詞典。
7.根據權利要求5所述的方法,其特征在于,所述方法進一步包括:
所述循環(huán)生成對抗網絡自動編碼器的總損失包括對抗性損失,周期一致性損失和重建損失。
8.根據權利要求7所述的方法,其特征在于,所述重建損失來源兩個所述判別器和兩個所述生成器。
9.一種移動終端,其特征在于,所述移動終端包括相互耦接的處理器和存儲器,所述存儲器用于存儲計算機程序,所述處理器用于加載所述計算機程序并執(zhí)行。
10.一種計算機存儲介質,其上存有計算機程序,其特征在于,所述計算機程序用于實現(xiàn)上述權利要求1~8中任一項方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于香港中文大學(深圳),未經香港中文大學(深圳)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011175684.0/1.html,轉載請聲明來源鉆瓜專利網。





