[發(fā)明專利]一種互譯詞條的獲取方法及系統(tǒng)無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201010138135.6 | 申請(qǐng)日: | 2010-03-31 |
| 公開(kāi)(公告)號(hào): | CN102207938A | 公開(kāi)(公告)日: | 2011-10-05 |
| 發(fā)明(設(shè)計(jì))人: | 張宇峰;郭永生 | 申請(qǐng)(專利權(quán))人: | 北京金山軟件有限公司;北京金山數(shù)字娛樂(lè)科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/28 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 逯長(zhǎng)明;王寶筠 |
| 地址: | 100085 北京市海淀*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 詞條 獲取 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,特別是涉及一種互譯詞條的獲取方法及系統(tǒng)。
背景技術(shù)
在信息交流的國(guó)際化趨勢(shì)下,多語(yǔ)言互譯的重要性日益顯著,計(jì)算機(jī)已經(jīng)成為最常用的信息互譯工具之一。最初計(jì)算機(jī)僅能起到電子字典的作用,隨著技術(shù)的發(fā)展,目前的計(jì)算機(jī)除了能夠?qū)崿F(xiàn)整句、整段文本的自動(dòng)化翻譯之外,還具有語(yǔ)言學(xué)習(xí)和推理等能力,使得翻譯出的文本更加符合人們的日常語(yǔ)言習(xí)慣。
計(jì)算機(jī)翻譯正逐漸向著智能化的方向發(fā)展,然而翻譯功能的實(shí)現(xiàn)仍然要以準(zhǔn)確、完整的互譯詞庫(kù)為基礎(chǔ)?,F(xiàn)有的翻譯軟件或在線翻譯網(wǎng)站都收錄了多種權(quán)威詞典,但是這些詞典的更新頻率非常低,很多新出現(xiàn)的詞句都沒(méi)有涉及,為了滿足各類用戶實(shí)際的翻譯需求,還需要不斷搜集新詞匯以完善互譯詞庫(kù)。
在現(xiàn)實(shí)生活中,每天都有大量的新詞匯產(chǎn)生,其中值得收錄的包括各領(lǐng)域的專業(yè)用語(yǔ)、社會(huì)流行用語(yǔ)等,互聯(lián)網(wǎng)是獲取這些新詞匯的主要來(lái)源。現(xiàn)有技術(shù)中,獲取新詞匯互譯詞條的方法是:先指定一些特定的雙語(yǔ)網(wǎng)站或者論壇,然后對(duì)這些網(wǎng)站頁(yè)面上的文本進(jìn)行采集并分析,找出其中的互譯詞條。然而在實(shí)際情況中,可用的互譯詞條資源實(shí)際上是存在于整個(gè)互聯(lián)網(wǎng)范圍的,僅指定一些特定的網(wǎng)站或論壇,會(huì)影響詞匯搜集的全面性。
發(fā)明內(nèi)容
為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供一種互譯詞條的獲取方法及系統(tǒng),以提高詞匯搜集的全面性,技術(shù)方案如下:
一種互譯詞條的獲取方法,包括:
A.選取至少一組已知的雙語(yǔ)互譯詞條;
B.以所述已知雙語(yǔ)互譯詞條的兩種語(yǔ)言文本作為搜索關(guān)鍵詞,生成針對(duì)搜索引擎的搜索請(qǐng)求;
C.將所述搜索請(qǐng)求發(fā)送給相應(yīng)的搜索引擎,獲得至少一條與所述搜索請(qǐng)求相匹配的搜索結(jié)果;
D.從所述搜索結(jié)果中提取新的互譯詞條。
一種互譯詞條獲取系統(tǒng),包括:初始化單元、搜求請(qǐng)求生成單元、搜索單元以及互譯詞條提取單元;
初始化單元,用于選取至少一組已知的雙語(yǔ)互譯詞條,并將選取結(jié)果發(fā)送至搜求請(qǐng)求生成單元;
搜求請(qǐng)求生成單元,用于以所述已知雙語(yǔ)互譯詞條的兩種語(yǔ)言文本作為搜索關(guān)鍵詞,生成針對(duì)搜索引擎的搜索請(qǐng)求,并將搜索請(qǐng)求發(fā)送至搜索單元;
搜索單元,用于將所述搜索請(qǐng)求發(fā)送給相應(yīng)的搜索引擎,獲得至少一條與所述搜索請(qǐng)求相匹配的搜索結(jié)果,并將搜索結(jié)果發(fā)送至互譯詞條提取單元;
互譯詞條提取單元,用于從所述搜索結(jié)果中提取新的互譯詞條。
本發(fā)明實(shí)施例提供的技術(shù)方案,利用搜索引擎來(lái)獲得可能包含互譯詞條的網(wǎng)頁(yè),再?gòu)木W(wǎng)頁(yè)中對(duì)互譯詞條進(jìn)行提取。由于搜索引擎所覆蓋的網(wǎng)頁(yè)涉及范圍很大,因此本發(fā)明與現(xiàn)有技術(shù)相比,能夠從更多的網(wǎng)頁(yè)中獲取互譯詞條,有效提高了詞匯搜集的全面性。此外,本發(fā)明實(shí)施例技術(shù)方案根據(jù)已知互譯詞條的文本生成搜索請(qǐng)求發(fā)送至搜索引擎,對(duì)于搜索引擎本身可以不做改進(jìn),也具有易于實(shí)現(xiàn)的優(yōu)點(diǎn)。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例互譯詞條的獲取方法的流程圖;
圖2為本發(fā)明實(shí)施例互譯詞條的獲取方法的另一種流程圖;
圖3為本發(fā)明實(shí)施例互譯詞條的獲取系統(tǒng)的一種結(jié)構(gòu)示意圖;
圖4為本發(fā)明實(shí)施例互譯詞條的獲取系統(tǒng)的另一種結(jié)構(gòu)示意圖;
圖5為本發(fā)明實(shí)施例互譯詞條的獲取系統(tǒng)的第三種結(jié)構(gòu)示意圖。
具體實(shí)施方式
首先對(duì)本發(fā)明實(shí)施例的一種互譯詞條的獲取方法進(jìn)行說(shuō)明,包括:
選取至少一組已知的雙語(yǔ)互譯詞條;
以所述已知雙語(yǔ)互譯詞條的兩種語(yǔ)言文本作為搜索關(guān)鍵詞,生成針對(duì)搜索引擎的搜索請(qǐng)求;
將所述搜索請(qǐng)求發(fā)送給相應(yīng)的搜索引擎,獲得至少一條與所述搜索請(qǐng)求相匹配的搜索結(jié)果;
從所述搜索結(jié)果中提取新的互譯詞條。
上述方法中,利用搜索引擎來(lái)獲得可能包含互譯詞條的網(wǎng)頁(yè),再?gòu)木W(wǎng)頁(yè)中對(duì)互譯詞條進(jìn)行提取。由于搜索引擎所覆蓋的網(wǎng)頁(yè)涉及范圍很大,因此本發(fā)明與現(xiàn)有技術(shù)相比,能夠從更多的網(wǎng)頁(yè)中獲取互譯詞條,有效提高了詞匯搜集的全面性。此外,上述方法根據(jù)已知互譯詞條的文本生成搜索請(qǐng)求發(fā)送至搜索引擎,對(duì)于搜索引擎本身可以不做改進(jìn),具有易于實(shí)現(xiàn)的優(yōu)點(diǎn)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京金山軟件有限公司;北京金山數(shù)字娛樂(lè)科技有限公司,未經(jīng)北京金山軟件有限公司;北京金山數(shù)字娛樂(lè)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010138135.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 創(chuàng)建詞條的方法及創(chuàng)建詞條的裝置
- 內(nèi)置詞條的顯示方法及顯示系統(tǒng)
- 用于展示候選詞條的方法和裝置
- 一種詞條轉(zhuǎn)化方法及裝置
- 操控句式生成、應(yīng)用操控方法及裝置、存儲(chǔ)介質(zhì)
- 詞條處理方法、移動(dòng)終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種詞條權(quán)重計(jì)算模型訓(xùn)練方法及裝置
- 一種基于區(qū)塊鏈的百科詞條管理系統(tǒng)和實(shí)施方法
- 目標(biāo)概念圖譜的構(gòu)建方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種待翻譯詞條的更新方法、裝置、設(shè)備和介質(zhì)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





