日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種多詞表達抽取方法及其裝置在審

專利信息
申請號: 201610990921.6 申請日: 2016-11-10
公開(公告)號: CN106649263A 公開(公告)日: 2017-05-10
發明(設計)人: 朱澤德;曾新華;鄭守國;孫熊偉;翁士狀 申請(專利權)人: 中科院合肥技術創新工程院
主分類號: G06F17/27 分類號: G06F17/27
代理公司: 暫無信息 代理人: 暫無信息
地址: 230001 安徽省合肥市高*** 國省代碼: 安徽;34
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 詞表 抽取 方法 及其 裝置
【說明書】:

技術領域

發明涉及統計機器翻譯和跨語言信息檢索技術領域,尤其是一種多詞表達抽取方法及其裝置。

背景技術

多詞表達是具有語法、語義或語用特性,并有意義完整的多個詞組合。多詞表達的識別能夠很好的提升分詞、詞性標注以及機器翻譯等工作的效率和準確性。在機器翻譯中,正確識別源語言中的多詞表達有助于選擇合適的翻譯,避免多個詞分別翻譯而導致的目標語言不自然甚至不能達意。

多詞表達的抽取方法基本分為基于統計的方法和基于規則的方法。基于規則的方法一般是具體研究某一種類型如動詞短語結構等或局限于某一個特定領域,基于統計的方法則可以抽取形式獨立的多詞表達,也就是利用統計信息無差別的抽取各種結構和領域的多詞表達。然而,現有的統計方法面臨的問題有:一維互信息需要人工設定閾值,對不同數據存在適應性問題,局限于多詞的二元結構,無法一次獲取多詞組合的多詞表達,且需分步實現,多詞表達庫建設的準確度低。

發明內容

本發明的首要目的在于提供一種一次性獲取多詞組合的多詞表達,無需分步實現,有效提高多詞表達抽取利用率,提高了多詞表達庫建設的準確度。

為實現上述目的,本發明采用了以下技術方案,一種多詞表達抽取方法,該方法包括下列順序的步驟:

(1)文檔庫采用分詞和詞性標注的預處理,形成源語言文檔;

(2)計算多文檔中相鄰詞匯的互信息,并進一步計算互信息序列前后的跳變信息;

(3)將互信息序列與跳變信息序列構成二維互信息集合;

(4)二維互信息集合采用分類器為多詞表達內點和外點,選多內點鏈接構建多詞表達。

進一步的,在所述步驟(1)中,針對收集文檔庫的所有文檔進行中文分詞、詞性標注和命名實體識別、詞性選擇的預處理構成有特定次序的候選詞匯集合。

進一步的,所述步驟(2)包括以下順序的步驟:

(a)計算多文檔中所有相鄰詞匯的互信息;

(b)計算互信息序列前后的跳變信息。

進一步的,所述步驟(3)中,根據互信息序列與跳變信息序列對應位置點,構建二維互信息(MIi,fi),多個二維互信息構成二維互信息集合。

進一步的,所述步驟(4)中,采用分類器將二維互信息集合中所有點,劃分為多詞表達內點和外點兩類,將包含內點的相鄰詞匯鏈接構成多詞表達。

進一步的,所述步驟(a)中,計算多文檔中相鄰詞匯的互信息,構成互信息序列MI,其中相鄰詞匯x和y的互信息計算MIi(0≤i<len(MI)-α)如下式:

其中,x和y表示相鄰詞匯;MIi表示相鄰詞匯x和y構成的第i個互信息;len(MI)表示互信息序列MI的長度;α表示一個常量;M表示所有文檔中詞匯的總數;p(x,y)表示詞匯x和y在所有文檔中共現次數;p(x)表示詞匯x在所有文檔中出現次數;p(y)表示詞匯y在所有文檔中出現次數;N表示文檔集中所有文檔的個數;Nx,y表示包含x和y共現的文檔個數。

進一步的,所述步驟(b)中,計算互信息序列前后的跳變信息,構成跳變信息序列f,其中的相鄰互信息的跳變信息fi計算公式如下:

其中,fi表示互信息序列中當前互信息和后續互信息的跳變信息;||表示取絕對值。

進一步的,所述α為2。

本發明的另一目的在于提供一種多詞表達抽取裝置,包括:

候選詞匯獲取裝置:針對收集文檔庫的所有文檔進行中文分詞、詞性標注和命名實體識別、詞性選擇的預處理構成具有特定次序的候選詞匯集合;

互信息和跳變信息獲取裝置:計算多文檔中相鄰候選詞匯的互信息,并跟據相鄰互信息計算互信息序列前后的跳變信息;

二維互信息獲取裝置:根據互信息序列與跳變信息序列位置對應的信息,選擇互信息和跳變信息構成二維互信息;

分類篩選多詞表達裝置:采用分類器將二維互信息集合中所有點,分類為多詞表達內點和外點兩類,將有內點的相鄰詞匯鏈接構成多詞表達。

由上述技術方案可知,本發明將相鄰詞匯間的互信息轉變成二維互信息,聚類二維互信息篩選出多詞表達,避免了一維互信息需要人工設定閾值,對不同數據的適應性問題,同時不局限于多詞的二元結構,可一次獲取多詞組合的多詞表達,且無需分步實現,有效提高多詞表達的利用率,提高了多詞表達庫建設的準確度。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科院合肥技術創新工程院,未經中科院合肥技術創新工程院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201610990921.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美精品免费看| 国产女人与拘做受免费视频| 夜夜爱av| 欧美激情视频一区二区三区| 国产一区二区精品在线| 国产精品v欧美精品v日韩| 欧美日韩偷拍一区| 国产亚洲久久| 99久久免费毛片基地| 欧美精品在线观看一区二区| 91狠狠操| 欧美一区二区三区艳史| 欧美日本91精品久久久久| 国产麻豆精品一区二区| 久久久精品欧美一区二区| 精品国产乱码久久久久久虫虫| 精品一区二区在线视频| 欧美色综合天天久久综合精品| 国产日韩欧美精品一区二区| 午夜社区在线观看| 91超碰caoporm国产香蕉| 激情久久一区| 蜜臀久久99精品久久久久久网站| 欧美日韩不卡视频| 国产91综合一区在线观看| 国产精品一区一区三区| 久99精品| 99日韩精品视频| 精品日韩久久久| 久久99亚洲精品久久99果| 日韩精品一区在线视频| 久久国产免费视频| 综合久久一区| 午夜叫声理论片人人影院| 久久国产免费视频| 色噜噜狠狠色综合久| 毛片免费看看| 国产天堂一区二区三区| 日韩一区免费| 亚洲精品乱码久久久久久写真| 91区国产| 夜夜嗨av色一区二区不卡| 久久精品国产亚洲7777| 午夜毛片电影| 综合久久国产九一剧情麻豆| 日韩精品一二区| 国产午夜精品一区二区三区视频| 久热精品视频在线| 午夜影院一级| 91精品啪在线观看国产手机| 日韩中文字幕在线一区| 久免费看少妇高潮a级特黄按摩| 91亚洲欧美强伦三区麻豆| 欧洲精品一区二区三区久久| 欧美一区二区精品久久| 精品美女一区二区三区| 亚洲福利视频二区| 国产91视频一区| xoxoxo亚洲国产精品| 国产丝袜在线精品丝袜91| 日本一区午夜艳熟免费| 国产精品视频一区二区在线观看 | 亚洲精品国产suv| 欧美精品二区三区| 香港三日三级少妇三级99| 强制中出し~大桥未久10在线播放| freexxxx性| 91国偷自产中文字幕婷婷| 激情久久一区二区| 日本亚洲国产精品| 欧美日韩一区二区在线播放| 97精品久久人人爽人人爽| 国产欧美视频一区二区| 日韩av一区二区在线播放| 免费看农村bbwbbw高潮| 制服丝袜视频一区| 一区二区精品久久| 国产欧美精品一区二区三区小说 | 亚洲伊人久久影院| 欧美乱战大交xxxxx| 91精品综合| 国产91精品高清一区二区三区| 狠狠色丁香久久婷婷综合_中| 国模精品免费看久久久| 国产原创一区二区 | 午夜影院啊啊啊| 精品少妇一区二区三区| 亚洲国产一区二| 99久久国产综合精品女不卡| 国产精品丝袜综合区另类| 日韩精品久久久久久久的张开腿让| 欧美黄色一二三区| 国产一级自拍片| 亚洲国产精品一区在线| 日本二区在线观看| 久久综合激情网| 亚洲精品日日夜夜| 99久久国产免费,99久久国产免费大片| 国产一区二区视频播放| 日本xxxx护士高潮hd| 高清欧美精品xxxxx| 亚洲国产精品日韩av不卡在线| 免费看性生活片| 国产一区二区三区在线电影| 国产一区二区综合| 激情久久一区| 久久精品国产亚洲一区二区| 欧美在线播放一区| xxxx在线视频| 国产一级不卡视频| 日韩午夜一区| 欧美精品一区二区三区四区在线| 99国精视频一区一区一三| 久久精品国产久精国产| 国产乱了高清露脸对白| 久久狠狠高潮亚洲精品| 国产欧美日韩精品在线| 久久久精品a| 国产三级一区二区| 国产精品伦一区二区三区在线观看| 欧美一区二区三区三州| 欧美日韩国产欧美| 日本一区二区免费电影| 国产一区网址| 国产精品久久久久久久综合| 91免费看国产| 久久免费视频99| 色噜噜狠狠色综合影视| 精品视频在线一区二区三区| 国产一区二区三区色噜噜小说| 99国产精品一区| 国产日韩欧美亚洲| 欧美一区二区三区中文字幕| 狠狠色很很在鲁视频| 狠狠色综合欧美激情| 欧美久久一区二区三区| 国产三级国产精品国产专区50| 国产二区三区视频| 欧美一区二区三区免费看| 国产日韩欧美精品| 亚洲欧美另类综合| 午夜爱爱电影| 91在线一区二区| 日韩久久精品一区二区三区| 狠狠色噜噜狠狠狠狠69| 99久久精品一区字幕狠狠婷婷 | 国产精品久久久久久久久久久新郎| 国产精品视频久久久久| 在线亚洲精品| 国产日韩欧美在线影视| 91日韩一区二区三区| 亚洲少妇中文字幕| 国产一区二区播放| 午夜av影视| 欧美日本三级少妇三级久久| 日韩av免费网站| 色婷婷精品久久二区二区我来| 亚洲国产精品一区在线观看| 在线视频不卡一区| 免费毛片a| 午夜精品99| 日韩av在线播| 日韩一级片免费视频| 日韩a一级欧美一级在线播放| 亚洲理论影院| 天堂av一区二区| 欧美日韩激情一区| 亚洲欧美日韩另类精品一区二区三区| 国产精品视频1区2区3区| 夜夜嗨av禁果av粉嫩av懂色av| 国产日韩欧美中文字幕| 99久久精品国产国产毛片小说| 欧美中文字幕一区二区| 欧美一区视频观看| 国产精品久久久久四虎| 日韩精品一区中文字幕| 国产无遮挡又黄又爽免费网站| 国产一区午夜| 色婷婷久久一区二区三区麻豆| 国产欧美久久一区二区三区| 亚洲制服丝袜在线| 91国偷自产一区二区介绍| 蜜臀久久久久久999| 综合久久国产九一剧情麻豆| 91久久精品国产亚洲a∨麻豆 | 午夜色大片| 亚洲国产精品肉丝袜久久| 久久久久国产精品视频| aaaaa国产欧美一区二区 | 久久精品国产久精国产| 狠狠插狠狠插| 国产精品96久久久久久久| 狠狠色噜噜狠狠狠狠2021免费| 国产麻豆精品一区二区| 欧美日韩国产免费观看| 国产极品一区二区三区| 日本xxxx护士高潮hd| 国产白嫩美女在线观看| 老女人伦理hd| 久久国产精彩视频| 欧美在线视频二区| 精品国产免费久久| 国产精品二区一区二区aⅴ| 亚洲精品乱码久久久久久按摩| 欧美日韩中文不卡| 麻豆精品一区二区三区在线观看| 一区二区三区精品国产| 国产91久久久久久久免费| 99久久精品国| 欧美日韩中文字幕三区| 免费a一毛片| 日韩av中文字幕第一页| 国产一区精品在线观看| 精品国产免费久久| 国产亚洲精品久久网站| 国产资源一区二区| 日日夜夜亚洲精品| 国产欧美日韩一区二区三区四区| 色天天综合久久久久综合片| 国产一区二区片| 国产欧美日韩精品一区二区三区| 欧美一区二区三区在线免费观看| 亚洲欧美日韩综合在线| 亚洲精品国产精品国自产网站按摩| 88国产精品视频一区二区三区| 久久免费视频一区| 日韩欧美国产中文字幕| 欧美日韩国产在线一区二区三区 | 久久99精品国产99久久6男男| 亚洲乱玛2021| 午夜激情在线播放| 国产亚洲精品久久网站| 国产一卡在线| 性国产日韩欧美一区二区在线 | 国产精品久久久久久亚洲美女高潮| 日韩av一区不卡| 999久久久国产| 日本精品在线一区| 强制中出し~大桥未久10在线播放| 久久久久国产精品一区二区三区| 国产精品高潮在线| 国产91电影在线观看| 亚洲激情中文字幕| 91人人爽人人爽人人精88v| 97精品国产97久久久久久| 日本一区二区三区在线看|