[發(fā)明專利]基于多語言翻譯的近義詞關(guān)聯(lián)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201410839087.1 | 申請(qǐng)日: | 2014-12-30 |
| 公開(公告)號(hào): | CN104537066A | 公開(公告)日: | 2015-04-22 |
| 發(fā)明(設(shè)計(jì))人: | 陳立杰;李之光 | 申請(qǐng)(專利權(quán))人: | 鄭州市中業(yè)科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 鄭州大通專利商標(biāo)代理有限公司 41111 | 代理人: | 陳勇;申文濤 |
| 地址: | 450002 河南省鄭*** | 國(guó)省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語言 翻譯 近義詞 關(guān)聯(lián) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)數(shù)據(jù)檢索和語義分析領(lǐng)域,特別涉及一種基于多語言翻譯的近義詞關(guān)聯(lián)方法。
背景技術(shù)
對(duì)于日常檢索,通常情況只能檢索出包含檢索關(guān)鍵字的信息,如果需要檢索包含關(guān)鍵字的相關(guān)同義詞或者近義詞信息,通常會(huì)變得非常困難;如果在多語言環(huán)境下實(shí)現(xiàn)關(guān)鍵字的檢索,幾乎是不可能完成這樣的工作。但不論專業(yè)的多語言的翻譯還是日常的跨多語言的信息檢索,都需要解決這個(gè)難題。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中的多語言翻譯或跨語言的同義詞檢索難題,本發(fā)明提供一種基于多語言翻譯的近義詞關(guān)聯(lián)方法,適用于信息檢索、搜索引擎、語言翻譯等,解決多種語言互譯、跨語言近義詞同義詞關(guān)聯(lián)的難點(diǎn)。
按照本發(fā)明所提供的設(shè)計(jì)方案,一種基于多語言翻譯的近義詞關(guān)聯(lián)方法,包含如下步驟:
步驟1、?????????將待翻譯信息轉(zhuǎn)化為源文字信息;
步驟2、?????????根據(jù)不同語言,將轉(zhuǎn)化的源文字信息存入文字處理單元,對(duì)文字處理單元存儲(chǔ)的源文字信息進(jìn)行分詞斷句,源文字信息、分詞斷句后的信息形成一條元素記錄存入結(jié)果集,并賦予該條元素記錄身份標(biāo)簽標(biāo)識(shí)和時(shí)間標(biāo)簽標(biāo)識(shí),若判定不同語言的詞組具有相同的涵義,則賦予該詞組統(tǒng)一標(biāo)簽標(biāo)識(shí),若判定同一語言的詞組具有相同的涵義,則賦予近義標(biāo)簽標(biāo)識(shí),并對(duì)該條元素記錄中的統(tǒng)一標(biāo)簽和近義標(biāo)簽加密處理,對(duì)具有相同的近義標(biāo)簽和統(tǒng)一標(biāo)簽的元素記錄賦予相同的父標(biāo)簽;
步驟3、?????????根據(jù)元素記錄中的關(guān)鍵字進(jìn)行信息關(guān)聯(lián)數(shù)據(jù)庫(kù)檢索,查找是否有對(duì)應(yīng)的記錄,若有,則完成關(guān)聯(lián);否則,進(jìn)入下一步驟;
步驟4、?????????將步驟2中賦予身份標(biāo)簽、時(shí)間標(biāo)簽、統(tǒng)一標(biāo)簽、近義標(biāo)簽和父標(biāo)簽的元素記錄存儲(chǔ)到信息關(guān)聯(lián)數(shù)據(jù)庫(kù)中,供用戶進(jìn)行信息關(guān)聯(lián)數(shù)據(jù)庫(kù)檢索。
上述的,步驟1中的待翻譯信息包含語音信息、文本信息、圖像信息及視頻信息,語音信息通過語音識(shí)別轉(zhuǎn)化為源文字信息,圖像信息通過圖像識(shí)別轉(zhuǎn)化為源文字信息,視頻信息通過視頻識(shí)別轉(zhuǎn)化為源文字信息。
上述的,步驟2的分詞斷句包含文字處理單元根據(jù)不同語言語系對(duì)源文字信息進(jìn)行分詞斷句,若源文字信息為拉丁語系,按照空格進(jìn)行分詞,并存入結(jié)果集;若源文字信息為東方語系,則先單字拆解,重新組合成詞組,并與該語系詞庫(kù)進(jìn)行匹配,若匹配成功,則為有效詞組,否則,視為無效詞組,將單字及該有效詞組存入結(jié)果集,將結(jié)果集中的詞組與信息關(guān)聯(lián)數(shù)據(jù)庫(kù)進(jìn)行匹配,如果詞組匹配成功,則視為已關(guān)聯(lián)詞組,從結(jié)果集中移除。
本發(fā)明基于多語言翻譯的近義詞關(guān)聯(lián)方法的有益效果:
本發(fā)明適用于信息檢索、搜索引擎、語言翻譯等,解決多種語言互譯、跨語言近義詞同義詞關(guān)聯(lián)的難點(diǎn),將每條元素記錄均賦予唯一的身份標(biāo)識(shí),不同語言的詞組具有相同的涵義,則賦予該詞組統(tǒng)一標(biāo)簽標(biāo)識(shí),同一語言的詞組具有相同的涵義,則賦予近義標(biāo)簽標(biāo)識(shí),并對(duì)該條元素記錄中的統(tǒng)一標(biāo)簽和近義標(biāo)簽加密處理,當(dāng)跨語言的多個(gè)元素記錄具有相同的統(tǒng)一標(biāo)簽或近義標(biāo)簽,則證明其之間是跨語言的近義詞或同義詞,可以方便的檢索出輸入的關(guān)鍵字的近義或同義的詳細(xì)信息,實(shí)現(xiàn)跨語言的同義詞及近義詞之間的匹配,提高信息檢索、語言翻譯的效率。
附圖說明:
圖1為本發(fā)明基于多語言翻譯的近義詞關(guān)聯(lián)方法的流程示意圖;
圖2為本發(fā)明的結(jié)果集存儲(chǔ)示意圖;
圖3為本發(fā)明的標(biāo)簽關(guān)聯(lián)方法示意圖;
圖4為本發(fā)明的實(shí)施例關(guān)聯(lián)示意圖。
具體實(shí)施方式:
下面結(jié)合附圖和技術(shù)方案對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明,并通過優(yōu)選的實(shí)施例詳細(xì)說明本發(fā)明的實(shí)施方式,但本發(fā)明的實(shí)施方式并不限于此。
實(shí)施例:參見圖1~4所示,一種基于多語言翻譯的近義詞關(guān)聯(lián)方法,包含如下步驟:
步驟1、?????將待翻譯信息轉(zhuǎn)化為源文字信息;
步驟2、?????根據(jù)不同語言,將轉(zhuǎn)化的源文字信息存入文字處理單元,對(duì)文字處理單元存儲(chǔ)的源文字信息進(jìn)行分詞斷句,源文字信息、分詞斷句后的信息形成一條元素記錄存入結(jié)果集,并賦予該條元素記錄身份標(biāo)簽標(biāo)識(shí)和時(shí)間標(biāo)簽標(biāo)識(shí),若判定不同語言的詞組具有相同的涵義,則賦予該詞組統(tǒng)一標(biāo)簽標(biāo)識(shí),若判定同一語言的詞組具有相同的涵義,則賦予近義標(biāo)簽標(biāo)識(shí),并對(duì)該條元素記錄中的統(tǒng)一標(biāo)簽和近義標(biāo)簽加密處理,對(duì)具有相同的近義標(biāo)簽和統(tǒng)一標(biāo)簽的元素記錄賦予相同的父標(biāo)簽;
步驟3、?????根據(jù)元素記錄中的關(guān)鍵字進(jìn)行信息關(guān)聯(lián)數(shù)據(jù)庫(kù)檢索,查找是否有對(duì)應(yīng)的記錄,若有,則完成關(guān)聯(lián);否則,進(jìn)入下一步驟;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鄭州市中業(yè)科技有限公司;,未經(jīng)鄭州市中業(yè)科技有限公司;許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410839087.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種電子地圖接入方法和裝置
- 下一篇:一種電子文檔的更新方法及裝置
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 自動(dòng)檢測(cè)文件中搭配錯(cuò)誤的系統(tǒng)和方法
- 網(wǎng)絡(luò)連接裝置及網(wǎng)絡(luò)連接裝置的語言環(huán)境設(shè)定方法
- 一種口語評(píng)測(cè)方法及裝置
- 一種語言設(shè)置方法及移動(dòng)終端
- 一種語言文本加載方法和裝置
- 一種語言交流人工智能系統(tǒng)及其語言處理方法
- 語言序列標(biāo)注方法、裝置存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 一種基于語言包實(shí)現(xiàn)繼電保護(hù)裝置多語言版本方法及裝置
- 一種應(yīng)用軟件的多語言核對(duì)方法及系統(tǒng)
- 多語言字幕顯示方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種構(gòu)建多語言網(wǎng)站實(shí)時(shí)翻譯的方法
- 一種待翻譯軟件的翻譯方法及裝置
- 一種待翻譯軟件的翻譯方法及裝置
- 一種CAT系統(tǒng)中翻譯記憶庫(kù)和MT結(jié)合的方法及系統(tǒng)
- 翻譯方法、系統(tǒng)、終端以及存儲(chǔ)介質(zhì)
- 一種文本展示方法及裝置
- 機(jī)器翻譯方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于機(jī)器翻譯引擎的翻譯方法及裝置
- 翻譯系統(tǒng)、翻譯方法、翻譯機(jī)及存儲(chǔ)介質(zhì)
- 文字翻譯方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)





