[發(fā)明專利]數(shù)據(jù)處理方法和裝置、用于數(shù)據(jù)處理的裝置有效
| 申請?zhí)枺?/td> | 201711474512.1 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN109992790B | 公開(公告)日: | 2023-09-29 |
| 發(fā)明(設計)人: | 姜里羊;王宇光;陽家俊;施亮亮;衛(wèi)林鈺;陳偉 | 申請(專利權)人: | 北京搜狗科技發(fā)展有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 陳梅君 |
| 地址: | 100084 北京市海淀區(qū)中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù)處理 方法 裝置 用于 | ||
本發(fā)明實施例提供了一種數(shù)據(jù)處理方法和裝置、用于數(shù)據(jù)處理的裝置,其中的方法具體包括:依據(jù)需要翻譯的源語言文本,確定需要訪問的目標數(shù)據(jù);其中,所述目標數(shù)據(jù)為翻譯記憶庫的數(shù)據(jù),所述翻譯記憶庫的數(shù)據(jù)被劃分為多個數(shù)據(jù)單元;依據(jù)數(shù)據(jù)單元與數(shù)據(jù)之間的映射關系,確定所述目標數(shù)據(jù)對應的目標數(shù)據(jù)單元;加載所述目標數(shù)據(jù)單元,以通過加載后的所述目標數(shù)據(jù)單元實現(xiàn)對于所述目標數(shù)據(jù)的訪問。本發(fā)明實施例可以降低對于內(nèi)存空間的占用,進而可以提高設備的運行速度;以及可以提高數(shù)據(jù)單元的加載速度。
技術領域
本發(fā)明涉及翻譯技術領域,特別是涉及一種數(shù)據(jù)處理方法和裝置、以及一種用于數(shù)據(jù)處理的裝置。
背景技術
翻譯技術是指利用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的技術。
現(xiàn)有的一種翻譯方法,可以依據(jù)已有的互為翻譯的平行語料得到翻譯記憶庫,并在機器翻譯的過程中,通過對于上述翻譯記憶庫的搜索和匹配技術,將源語言文本翻譯為上述翻譯記憶庫中記錄的目標語言文本。
然而,在實際應用中,翻譯記憶庫的數(shù)據(jù)量通常很大,這樣,在機器翻譯的過程中,將翻譯記憶庫加載到設備的內(nèi)存中,需要占用大量的內(nèi)存空間;而設備的內(nèi)存容量往往是有限的,對于移動設備而言這種情況尤其明顯,內(nèi)存空間的大量占用意味著執(zhí)行多任務工作時運行速度會更緩慢,也即影響設備的運行速度。并且,將翻譯記憶庫加載到設備的內(nèi)存中,需要花費較長的加載時間。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明實施例以便提供一種克服上述問題或者至少部分地解決上述問題的數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置、用于數(shù)據(jù)處理的裝置,本發(fā)明實施例可以降低對于內(nèi)存空間的占用,進而可以提高設備的運行速度;以及可以提高數(shù)據(jù)單元的加載速度。
為了解決上述問題,本發(fā)明實施例公開了一種數(shù)據(jù)處理方法,包括:
依據(jù)需要翻譯的源語言文本,確定需要訪問的目標數(shù)據(jù);其中,所述目標數(shù)據(jù)為翻譯記憶庫的數(shù)據(jù),所述翻譯記憶庫的數(shù)據(jù)被劃分為多個數(shù)據(jù)單元;
依據(jù)數(shù)據(jù)單元與數(shù)據(jù)之間的映射關系,確定所述目標數(shù)據(jù)對應的目標數(shù)據(jù)單元;
加載所述目標數(shù)據(jù)單元,以通過加載后的所述目標數(shù)據(jù)單元實現(xiàn)對于所述目標數(shù)據(jù)的訪問。
可選地,通過映射函數(shù)表征所述數(shù)據(jù)單元與數(shù)據(jù)之間的映射關系;所述確定所述目標數(shù)據(jù)對應的目標數(shù)據(jù)單元,包括:
通過所述映射函數(shù),將所述目標數(shù)據(jù)的關鍵字轉換為所述目標數(shù)據(jù)所對應目標數(shù)據(jù)單元的信息。
可選地,所述目標數(shù)據(jù)單元的信息包括如下信息中任一項或多項:標識信息、存儲地址信息。
可選地,一個所述數(shù)據(jù)單元對應的數(shù)據(jù)量在預設數(shù)據(jù)量范圍內(nèi),和/或,所述數(shù)據(jù)單元的數(shù)量在預設數(shù)量范圍內(nèi)。
可選地,所述數(shù)據(jù)單元的類型包括如下信息中任一項或多項:文件類型、數(shù)據(jù)庫類型。
可選地,所述翻譯記憶庫的數(shù)據(jù)包括:互為翻譯的雙語對;所述雙語對包括:第一語言文本和第二語言文本。
可選地,所述方法應用于移動設備,所述多個數(shù)據(jù)單元被存儲于所述移動設備的閃存,所述加載所述目標數(shù)據(jù)單元,包括:
從所述移動設備的閃存讀取所述目標數(shù)據(jù)單元對應的數(shù)據(jù),并將讀取的數(shù)據(jù)存儲于所述移動設備的運行內(nèi)存。
另一方面,本發(fā)明實施例公開了一種數(shù)據(jù)處理方法,包括:
將翻譯記憶庫的數(shù)據(jù)劃分為多個數(shù)據(jù)單元;其中,一個所述數(shù)據(jù)單元與其對應的數(shù)據(jù)之間具有映射關系;
對所述多個數(shù)據(jù)單元進行存儲。
可選地,通過映射函數(shù)表征所述數(shù)據(jù)單元與數(shù)據(jù)之間的映射關系,所述將翻譯記憶庫的數(shù)據(jù)劃分為多個數(shù)據(jù)單元,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711474512.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





