日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種網(wǎng)絡(luò)可比語料的挖掘方法有效

專利信息
申請?zhí)枺?/td> 201310382010.1 申請日: 2013-08-28
公開(公告)號: CN103473280B 公開(公告)日: 2017-02-08
發(fā)明(設(shè)計)人: 李淼;朱澤德;張健;曾新華;陳雷;曾偉輝;鄭守國;高會議;胡澤林;楊振新;陳晟;李華龍;董瀚琳;吳娜;卞程飛;翁士狀 申請(專利權(quán))人: 中國科學院合肥物質(zhì)科學研究院
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 合肥天明專利事務(wù)所34115 代理人: 奚華保
地址: 230031 *** 國省代碼: 安徽;34
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 網(wǎng)絡(luò) 可比 語料 挖掘 方法
【說明書】:

技術(shù)領(lǐng)域

發(fā)明涉及統(tǒng)計機器翻譯和跨語言信息檢索技術(shù)領(lǐng)域,尤其是一種網(wǎng)絡(luò)可比語料的挖掘方法及裝置。

背景技術(shù)

可比語料庫是由語言不同、內(nèi)容相似但非互譯的文檔構(gòu)成的集合,從中挖掘雙語術(shù)語、命名實體、平行句對等細粒度的翻譯等價促進了詞典編纂、跨語言信息檢索和統(tǒng)計機器翻譯等領(lǐng)域的發(fā)展。相對于平行語料,可比語料內(nèi)容的相似性降低了平行語料中源語言和目標語言文檔互譯的要求,使可比語料具有語言真實、來源廣闊、領(lǐng)域全面、內(nèi)容新穎和易于獲取的優(yōu)勢。

現(xiàn)有的可比較語料構(gòu)建主要通過特征信息、跨語言檢索和維基百科等方法來實現(xiàn)。在特征信息方面,采用新聞發(fā)布日期、語言無關(guān)單元、雙語字典和詞頻分布等特征計算文檔對的相似性;在跨語言檢索方面,將某一語言文檔中特定頻率詞匯或關(guān)鍵詞翻譯成另一語言作為查詢詞檢索文檔,構(gòu)成可比語料庫;在維基百科方面,以維基百科類別信息作為主題約束,以語言鏈接進行雙語映射采集相應(yīng)源語言和目標語言的百科頁面。然而,上述三種方法面臨的問題有:詞匯翻譯中的歧義、雙語知識的覆蓋度不足或可比語料局限于特定數(shù)據(jù)來源。

發(fā)明內(nèi)容

本發(fā)明的首要目的在于提供一種避免詞匯翻譯歧義的產(chǎn)生,降低對雙語知識的依賴,提高語料庫建設(shè)的準確度的網(wǎng)絡(luò)可比語料的挖掘方法。

為實現(xiàn)上述目的,本發(fā)明采用了以下技術(shù)方案:一種網(wǎng)絡(luò)可比語料的挖掘方法,該方法包括下列順序的步驟:

(1)利用網(wǎng)絡(luò)爬蟲獲取源語言網(wǎng)頁,經(jīng)預處理后形成源語言文檔;

(2)根據(jù)已有的雙語語料庫構(gòu)建跨語言主題模型,分析源語言文檔的跨語言主題的概率,利用源語言文檔主題信息產(chǎn)生對應(yīng)的目標語言查詢詞;

(3)將目標語言查詢詞提交搜索引擎,獲取網(wǎng)絡(luò)中的目標語言文檔,選取前N的文檔構(gòu)成目標語言候選相似文檔集;

(4)分析目標語言候選相似文檔的跨語言主題概率分布,根據(jù)主題概率分布的KL散度計算源語言文檔和目標語言候選相似文檔的相似度,篩選出相似度較高的源語言文檔和目標語言候選相似文檔構(gòu)建可比語料庫。

在所述步驟(1)中,利用網(wǎng)絡(luò)爬蟲抓取源語言原始網(wǎng)頁并存儲至本地數(shù)據(jù)庫中,對收集的網(wǎng)頁進行除去導航條、相關(guān)鏈接的去噪聲處理,對網(wǎng)頁的正文內(nèi)容進行分詞、詞性標注、命名實體識別、詞性選擇的預處理。

所述步驟(2)包括以下順序的步驟:

(a)在已有的雙語語料庫的基礎(chǔ)上,利用跨語言隱含狄利克雷分配的方法獲取多個跨語言主題模型;

(b)跨語言主題模型對源語言文檔進行語義分析,獲取每一跨語言主題的概率;

(c)根據(jù)源語言文檔的跨語言主題分布和每個主題中目標語言詞匯的概率分布,獲取目標語言候選查詢詞;

(d)根據(jù)目標語言單語語料庫中詞匯的統(tǒng)計信息,合并目標語言候選查詢詞形成目標語言查詢詞。

在所述步驟(3)中,N為10。

在所述步驟(4)中,源語言文檔和目標語言候選相似文檔的跨語言主題概率分布的KL散度作為衡量源語言文檔和目標語言候選相似文檔的相似度,相似度計算公式如下:

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院合肥物質(zhì)科學研究院,未經(jīng)中國科學院合肥物質(zhì)科學研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310382010.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲精品日韩精品| 欧美激情视频一区二区三区免费| 国产精品久久99| 亚洲va欧美va国产综合先锋| 黄色国产一区二区| 午夜免费片| 午夜激情电影在线播放| 大伊人av| 右手影院av| 国产一区午夜| 欧美一区二区三区久久精品视| 精品国产乱码久久久久久虫虫| 男女视频一区二区三区| 日韩av在线一区| 国产电影一区二区三区下载| 国产在线一区观看| 欧美日韩一级在线观看| 午夜叫声理论片人人影院| 精品免费久久久久久久苍| 国产69精品久久777的优势| 精品视频在线一区二区三区| 在线精品国产一区二区三区| 欧美一区二区三区久久精品视| 一区二区三区毛片| 久久精品综合| 丰满少妇高潮惨叫久久久一| 国产精品美女久久久免费| 真实的国产乱xxxx在线91| 99国产精品9| 国产电影一区二区三区下载| 538国产精品| 日本一区二区三区在线看| 亚洲国产aⅴ精品一区二区16| 日本一区午夜艳熟免费| 国产日韩一区在线| 精品国产乱码一区二区三区在线| 久久久一二区| 午夜三级大片| 日韩欧美国产第一页| 精品国产乱码久久久久久a丨| 色乱码一区二区三在线看| 大bbw大bbw巨大bbw看看| 国产91刺激对白在线播放| 亚洲欧美制服丝腿| 欧美三级午夜理伦三级老人| 99精品久久久久久久婷婷| xoxoxo亚洲国产精品| 97久久精品人人做人人爽| 亚洲乱码一区二区三区三上悠亚 | 91精品一区二区在线观看| 97国产精品久久| 二区三区免费视频| 日本一区二区三区中文字幕| 久久天天躁夜夜躁狠狠躁2022| 7799国产精品久久99| 国产精品1234区| 国产精品v欧美精品v日韩| 精品免费久久久久久久苍| 香蕉av一区| 亚洲精品久久久久中文字幕欢迎你| 日韩av三区| 农村妇女精品一区二区| 91精品久久天干天天天按摩| 午夜欧美a级理论片915影院| 久久精视频| 欧美日韩国产在线一区| 91看片app| xxxx18日本护士高清hd| 91久久精品久久国产性色也91| 538在线一区二区精品国产| 国产精品麻豆一区二区三区| 一区二区三区欧美在线| 中文字幕在线视频一区二区| 一区二区在线精品| 91精品综合| 国产精品久久久不卡| 国产超碰人人模人人爽人人添| 午夜国产一区二区三区四区| 亚洲国产一区二区精品| 少妇高潮一区二区三区99小说| 国产亚洲精品久久久久久网站| 三级电影中文| 国产日韩欧美自拍| 国产主播啪啪| 国产高清一区二区在线观看| 欧美极品少妇xxxxⅹ| 好吊妞国产欧美日韩免费观看网站| 欧美一级免费在线视频| 国产黄色网址大全| 97人人模人人爽人人喊38tv| 91精品一区二区在线观看| 亚洲国产偷| 国产清纯白嫩初高生在线播放性色 | 性欧美激情日韩精品七区| 国产精品99一区二区三区| 国产精品亚洲精品一区二区三区| 亚洲精品少妇久久久久| 精品久久久久99| 国产精品日韩三级| 粉嫩久久久久久久极品| 久久er精品视频| 久久99精品国产一区二区三区| 国产在线一区不卡| 91九色精品| 91麻豆精品国产91久久| 国产69久久| 欧美精品六区| 亚洲国产精品区| 欧美日韩一卡二卡| 国产高清在线一区| 国产足控福利视频一区| 国产精品视频1区| 欧美色综合天天久久综合精品| 亚洲欧洲另类精品久久综合| 国产www亚洲а∨天堂| 国产真实一区二区三区| 久久99中文字幕| 狠狠色噜噜狠狠狠狠视频| 国产福利精品一区| 国产69精品久久久久777糖心| 国产视频一区二区三区四区| 久久精品二| 午夜免费一级片| 国产色午夜婷婷一区二区三区| 97人人揉人人捏人人添| 久久精品国产精品亚洲红杏| 亚洲一级中文字幕| 国产69精品久久久久久野外| 美国三级日本三级久久99| 色噜噜狠狠色综合中文字幕| 国产在线一区观看| 首页亚洲欧美制服丝腿 | 亚洲欧洲日韩在线| 国产精品白浆一区二区| 欧美高清性xxxxhd| 欧美日韩一区二区三区在线播放| 欧美色综合天天久久综合精品| 国产一区激情| 国产一区二区影院| 欧美激情精品久久久久久免费| 国产精品免费自拍| 最新国产精品久久精品| 亚洲欧美一二三| 国内久久久久久| 一区二区欧美精品| 亚洲精品一区二区三区98年| 国产精品奇米一区二区三区小说| av午夜在线| 亚洲国产日韩综合久久精品| 国产一区二区a| 欧美激情综合在线| 国产欧美一区二区三区在线播放| 欧美日韩一区二区三区四区五区六区| 狠狠躁夜夜躁| 免费xxxx18美国| freexxxx性| xx性欧美hd| 色偷偷一区二区三区| 国产精品二区一区| 狠狠色噜噜狠狠狠狠88| 欧美精品一区久久| 国产在线干| 夜夜躁日日躁狠狠久久av| 性国产videofree极品| 日本美女视频一区二区| 狠狠色成色综合网| 天天干狠狠插| 亚洲国产精品美女| 亚洲福利视频一区二区| 免费高潮又黄又色又爽视频| 欧美一区二区三区不卡视频| 99精品视频免费看| 激情久久久久久| a级片一区| 亚洲精品456| 欧美精品久久一区二区| 九一国产精品| 综合色婷婷一区二区亚洲欧美国产 | 中文字幕制服狠久久日韩二区| 天天射欧美| 特高潮videossexhd| 国产欧美一区二区三区沐欲 | 欧美精品中文字幕在线观看| 97国产精品久久久| 国产人澡人澡澡澡人碰视| 97人人模人人爽视频一区二区 | 久久综合伊人77777麻豆| 一区二区在线精品| 精品福利一区| 四虎影视亚洲精品国产原创优播| 91久久久久久亚洲精品禁果| av午夜影院| 大伊人av| 久久99精品国产麻豆婷婷洗澡| 久久综合二区| 欧美激情综合在线| 国产欧美日韩精品在线| 亚洲高清毛片一区二区| 久久国产免费视频| 欧美激情视频一区二区三区免费 | 亚洲欧美日韩三区| 日本免费电影一区二区| 国产91在线播放| 国产免费第一区| 日韩精品一区在线视频| 国产乱子一区二区| 国产日韩欧美91| 中文字幕日本精品一区二区三区| xxxxhd欧美| 国产经典一区二区| 亚洲一区欧美| 久久99精品国产麻豆婷婷洗澡| 精品综合久久久久| 国产高清一区在线观看| 男女无遮挡xx00动态图120秒| 久久影院一区二区| 亚洲国产aⅴ精品一区二区16| 天干天干天啪啪夜爽爽99| 国产一区www| 麻豆天堂网| 日本一区二区三区电影免费观看| 精品国产九九九| 蜜臀久久99精品久久一区二区| 亚洲精品国产一区二| 欧美一区二区三区免费看| 中文字幕制服狠久久日韩二区| 国产精品一区一区三区| 窝窝午夜精品一区二区| 午夜精品在线播放| 日韩av在线影视| 日本午夜一区二区| aaaaa国产欧美一区二区| 久久久人成影片免费观看| 国产的欧美一区二区三区| 国产视频一区二区视频| 91看片淫黄大片91| 国产精品高潮呻吟三区四区| 美国三级日本三级久久99| 91久久国产露脸精品| 99久久精品一区二区| 国产一区午夜| 中文字幕日韩有码| 国产精品一区二区av日韩在线| 国产精品视频一二区| 国产精品一区二区在线观看| 日本一二三区视频在线|