[發(fā)明專利]跨語言知識單元遷移方法、裝置、存儲介質(zhì)及終端在審
| 申請?zhí)枺?/td> | 202110693347.9 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113590578A | 公開(公告)日: | 2021-11-02 |
| 發(fā)明(設計)人: | 吳旭;吳京宸;頡夏青;管子鍵;邱莉榕;楊金翠;孫利娟;張勇東 | 申請(專利權(quán))人: | 北京郵電大學 |
| 主分類號: | G06F16/21 | 分類號: | G06F16/21;G06F16/28;G06F16/36;G06F16/35 |
| 代理公司: | 北京辰權(quán)知識產(chǎn)權(quán)代理有限公司 11619 | 代理人: | 李小朋 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語言 知識 單元 遷移 方法 裝置 存儲 介質(zhì) 終端 | ||
1.一種跨語言知識單元遷移方法,其特征在于,所述方法包括:
獲取兩種不同語言各自的知識圖譜,并獲取所述兩種不同語言對應的跨語言知識對齊種子庫;
針對所述知識圖譜中不同語義層次的知識單元建模后得到第一建模結(jié)果;
針對所述知識圖譜中同一語義層次的知識單元建模后得到第二建模結(jié)果;
將所述第一建模結(jié)果與所述第二建模結(jié)果拼接后,生成拼接結(jié)果;
根據(jù)所述拼接結(jié)果以及所述跨語言知識對齊種子庫,并通過對齊模型的損失函數(shù)將所述知識單元各自的向量空間進行線性轉(zhuǎn)換,生成轉(zhuǎn)換后的知識單元;
計算所述轉(zhuǎn)換后的知識單元的距離和置信度進行跨語言知識單元遷移。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述知識單元由模部分和相位部分組成;
所述針對所述知識圖譜中不同語義層次的知識單元建模后得到第一建模結(jié)果,包括:
根據(jù)所述模部分的損失函數(shù)將所述兩種不同語言各自的知識圖譜的知識單元嵌入到與其對應的向量空間中,得到模部分嵌入;
將所述模部分嵌入確定為第一建模結(jié)果。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述針對所述知識圖譜中同一語義層次的知識單元建模后得到第二建模結(jié)果,包括:
根據(jù)所述相位部分的損失函數(shù)將所述兩種不同語言各自的知識圖譜的知識單元嵌入到與其對應的向量空間中,得到相位部分嵌入;
將所述相位部分嵌入確定為第二建模結(jié)果。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將所述第一建模結(jié)果與所述第二建模結(jié)果拼接后,生成拼接結(jié)果,包括:
將所述模部分嵌入與所述相位部分嵌入進行拼接,生成不同語言知識圖譜各自的知識單元嵌入表示;
將所述不同語言知識圖譜各自的知識單元嵌入表示確定為拼接結(jié)果。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,
所述模部分和/或相位部分嵌入與其對應的向量空間中是通過知識模型將所述知識單元嵌入到極坐標系中;
其中,所述極坐標系中徑向坐標和角坐標分別對應于所述模部分和所述相位部分,所述知識模型將每個所述知識單元e表示為[em;ep],其中em和ep分別由所述模部分和所述相位部分生成,[·;·]表示兩個向量的拼接。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述計算所述轉(zhuǎn)換后的知識單元的距離和置信度進行跨語言知識單元遷移,包括:
根據(jù)所述模部分和/或相位部分的距離函數(shù)計算所述轉(zhuǎn)換后的知識單元的距離;
根據(jù)所述轉(zhuǎn)換后的知識單元的距離評估置信度;
根據(jù)所述置信度的大小得到目標對齊知識單元;
根據(jù)所述目標對齊知識單元預測所述知識圖譜的潛在關系;
基于所述潛在關系預測所述知識圖譜中的鏈路,并補全所述知識圖譜中不完備的圖譜。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述轉(zhuǎn)換后的知識單元為所述兩種不同語言各自的知識圖譜的向量空間轉(zhuǎn)換矩陣。
8.一種跨語言知識單元遷移裝置,其特征在于,所述裝置包括:
數(shù)據(jù)信息獲取模塊,用于獲取兩種不同語言各自的知識圖譜,并獲取所述兩種不同語言對應的跨語言知識對齊種子庫;
第一建模結(jié)果生成模塊,用于針對所述知識圖譜中不同語義層次的知識單元建模后得到第一建模結(jié)果;
第二建模結(jié)果生成模塊,用于針對所述知識圖譜中同一語義層次的知識單元建模后得到第二建模結(jié)果;
建模結(jié)果拼接模塊,用于將所述第一建模結(jié)果與所述第二建模結(jié)果拼接后,生成拼接結(jié)果;
空間向量轉(zhuǎn)換模塊,用于根據(jù)所述拼接結(jié)果以及所述跨語言知識對齊種子庫,并通過對齊模型的損失函數(shù)將所述知識單元各自的向量空間進行線性轉(zhuǎn)換,生成轉(zhuǎn)換后的知識單元;
知識單元遷移模塊,用于計算所述轉(zhuǎn)換后的知識單元的距離和置信度進行跨語言知識單元遷移。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學,未經(jīng)北京郵電大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110693347.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





