[發明專利]一種翻譯記憶庫模糊查詢方法及系統在審
| 申請號: | 202310257043.7 | 申請日: | 2023-03-16 |
| 公開(公告)號: | CN116303674A | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 關祎寧 | 申請(專利權)人: | 沈陽創思佳業科技有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F40/49;G06F40/58;G06F40/166;G06F16/33 |
| 代理公司: | 北京東方盛凡知識產權代理有限公司 11562 | 代理人: | 程小芳 |
| 地址: | 110000 遼寧省沈陽市皇姑區昆山西*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 翻譯 記憶 模糊 查詢 方法 系統 | ||
1.一種翻譯記憶庫模糊查詢方法,其特征在于,包括如下步驟:
將輸入文本中的每一個單詞進行數字化表達,并進行數字對比;
基于數字對比的結果,進行編輯距離計算,得出所述輸入文本同當前翻譯記憶庫中的原文的編輯距離;
當所述翻譯記憶庫中的全部原文都參與了所述編輯距離計算,并得到對應的編輯距離后,取編輯距離最小的一組翻譯記憶庫原文作為同輸入文本相似度最高的模糊查詢結果。
2.根據權利要求1所述的翻譯記憶庫模糊查詢方法,其特征在于,
所述單詞的數字表達方法為:
N=fw-n(w)
其中,N為單詞轉換后的數字內容,w為單詞轉換前的文本內容。
3.根據權利要求1所述的翻譯記憶庫模糊查詢方法,其特征在于,
所述編輯距離使用虛擬X-Y直角坐標系進行計算,其中X軸刻度值用輸入文本的單詞順序表達,Y軸刻度值則用翻譯記憶庫原文單詞順序表達。
4.根據權利要求3所述的翻譯記憶庫模糊查詢方法,其特征在于,
使用所述虛擬X-Y直角坐標系計算所述編輯距離的方法包括:
將所述輸入文本的單詞按從左到右的順序依次放到位于X軸上的坐標點上,將所述翻譯記憶庫中原文的單詞內容按從左到右的順序依次以X軸坐標點為參照點,放到與之內容相等的所述輸入文本對應單詞的X軸坐標點的正上方坐標點;
在所述虛擬X-Y直角坐標系上模擬一條可平行移動的斜線,使其位于X軸下方位置開始向上平移,每次平移都需要同當前所述翻譯記憶庫中原文的一個單詞坐標點相交,此時記錄所述虛擬X-Y直角坐標系上當前所述翻譯記憶庫原文的每個單詞坐標點同當前斜線的垂直刻度差,即垂直距離,取所述垂直距離之和,作為此次平移的計算結果;
當斜線繼續做向上平移處理直至同當前所述翻譯記憶庫原文的全部單詞內容坐標點發生了相交且得到了計算結果后,取上述最小的計算結果作為編輯距離。
5.一種翻譯記憶庫模糊查詢系統,其特征在于,包括數字表達模塊、編輯距離計算模塊和查詢結果輸出模塊:
所述數字表達模塊用于將輸入文本中的每一個單詞進行數字化表達,并進行數字對比;
所述編輯距離計算模塊用于基于數字對比的結果,進行編輯距離計算,得出所述輸入文本同當前翻譯記憶庫中的原文的編輯距離;
所述查詢結果輸出模塊用于篩選出所述編輯距離最小的一組翻譯記憶庫原文,并將其作為同輸入文本相似度最高的模糊查詢結果進行輸出。
6.根據權利要求5所述的翻譯記憶庫模糊查詢系統,其特征在于,
所述單詞的數字表達方法為:
N=fw-n(w)
其中,N為單詞轉換后的數字內容,w為單詞轉換前的文本內容。
7.根據權利要求5所述的翻譯記憶庫模糊查詢系統,其特征在于,
編輯距離計算模塊包括虛擬X-Y直角坐標系單元;
所述編輯距離使用虛擬X-Y直角坐標系進行計算,其中X軸刻度值用輸入文本的單詞順序表達,Y軸刻度值則用翻譯記憶庫原文單詞順序表達。
8.根據權利要求7所述的翻譯記憶庫模糊查詢系統,其特征在于,
使用所述虛擬X-Y直角坐標系單元計算所述編輯距離的方法包括:
將所述輸入文本的單詞按從左到右的順序依次放到位于X軸上的坐標點上,將所述翻譯記憶庫中原文的單詞內容按從左到右的順序依次以X軸坐標點為參照點,放到與之內容相等的所述輸入文本對應單詞的X軸坐標點的正上方坐標點;
在所述虛擬X-Y直角坐標系上模擬一條可平行移動的斜線,使其位于X軸下方位置開始向上平移,每次平移都需要同當前所述翻譯記憶庫中原文的一個單詞坐標點相交,此時記錄所述虛擬X-Y直角坐標系上當前所述翻譯記憶庫原文的每個單詞坐標點同當前斜線的垂直刻度差,即垂直距離,取所述垂直距離之和,作為此次平移的計算結果;
當斜線繼續做向上平移處理直至同當前所述翻譯記憶庫原文的全部單詞內容坐標點發生了相交且得到了計算結果后,取上述最小的計算結果作為編輯距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于沈陽創思佳業科技有限公司,未經沈陽創思佳業科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310257043.7/1.html,轉載請聲明來源鉆瓜專利網。





