日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于事件結構的中文語句分析方法無效

專利信息
申請?zhí)枺?/td> 201210439007.4 申請日: 2012-11-07
公開(公告)號: CN103268311A 公開(公告)日: 2013-08-28
發(fā)明(設計)人: 張旭潔;朱平;劉宗田;劉煒;王東;田垅 申請(專利權)人: 上海大學;國際竹藤中心
主分類號: G06F17/27 分類號: G06F17/27
代理公司: 上海上大專利事務所(普通合伙) 31205 代理人: 何文欣
地址: 200444*** 國省代碼: 上海;31
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 事件 結構 中文 語句 分析 方法
【說明書】:

技術領域

發(fā)明涉及一種基于事件結構的中文語句分析方法,屬于自然語言處理(Natural?Language?Processing)領域。

背景技術

自然語言中大量存在對人類生活中各類事件的描述(小到一個動作,大到一個歷史事件),同時也包括事件產生的時間、地點、參與的角色、狀態(tài)以及事件之間的關系等內容與特征的描述。本發(fā)明的基于事件結構的中文語句分析方法即是從理解事件結構的角度對語句中的各成分進行分析和映射,并用形式化的方法進行表示。不同的語言有不同的表示方法和表示規(guī)律。人們可以通過認識事件以及事件之間的關系來認識和了解世界。這也是自然語言處理領域關于事件的研究所關注的重要內容之一。隨著互聯(lián)網(wǎng)相關技術的興起,人們越來越多的依賴于網(wǎng)絡來獲取信息,而互聯(lián)網(wǎng)的信息呈現(xiàn)出海量、劇增和冗余等特性,為了能更好的監(jiān)控和運用其中的信息,讓機器能夠分析文本中的事件,面向事件的語句分析研究顯得越來越重要。美國國防高級研究計劃委員會(Defense?Advanced?Research?Projects?Agency,DARPA)主辦的話題識別與跟蹤(Topic?Detection?and?Tracking,TDT)評測會議,其目的就是要發(fā)展一系列基于事件的信息組織技術。國家自然科學基金委員會將“非常規(guī)突發(fā)事件應急管理研究”列入2012年重大研究計劃。

語句分析就是指對語句中的各成分功能和語義進行分析,將輸入句子中單詞之間的線性詞序,變成一個非線性的數(shù)據(jù)結構?;谑录Y構的語句分析就是指將語句中的各成分映射到所描述的事件結構或組成上。具體的說就是按照不同事件及事件角色進行分析,將一個中文句子表示為若干事件指示詞和與之對應的事件角色包括非事件角色相關成分的樹形結構。從理解事件的角度對一個句子進行基于事件結構的語句分析是近一步實現(xiàn)語義理解的必經(jīng)之路。目前自然語言處理領域關于語句分析的主要理論包括:依存句法、喬姆斯基發(fā)展的形式語法理論即短語結構語法及其擴展,如:詞匯功能語法、功能合一語法、廣義短語結構語法、中心詞驅動的短語結構語法。這些方法的思想都建立在英文的語法知識基礎之上,沒有從理解事件的角度將句子中的成分劃分為事件與事件角色并分析它們之間的關系。目前對于事件的研究大多集中在從文本中識別和抽取事件以及事件角色提取、基于事件的自動文摘和文本自動生成等方面,這些研究都迫切需要本發(fā)明的基于事件結構的語句分析方法的支持。采用本發(fā)明構建的基于事件結構的中文語句分析的語料庫不僅可以為機器學習與數(shù)據(jù)挖掘提供第一手的特征信息,還能用來進行數(shù)據(jù)統(tǒng)計,構建統(tǒng)計或概率模型,抽取語言規(guī)則,最重要的是它將為基于事件的信息處理技術提供比較和評測的標準。

目前已有的語句分析方法雖然從一定程度上反映了句子的語法結構,但還沒有一種方法從分析事件的角度對句子中的成分進行分析,且存在以下不足:(1)以語法功能分析為中心,不全適用于中文的語句分析(中文是意合的語言);(2)以動詞為中心不能覆蓋句中的所有事件(如:事件名詞“地震”、“火災”等);(3)缺少對修飾成分、介詞、連接詞和其它成分的語義功能說明。

發(fā)明內容

鑒于以上所述現(xiàn)有技術存在的問題和不足,本發(fā)明提出了基于事件結構的中文語句分析方法,該方法在詞法分析與依存語句分析的基礎之上,從分析事件與事件角色的角度將語句中的成分再次劃分為事件指示詞、事件指示詞對應的事件角色、修飾成分、介詞、連接詞和其它詞語成分,通過標簽設置,并添加各成分的語義功能說明,將句子結構由線性序轉換為基于事件及其角色的樹結構。

本發(fā)明的基于事件結構的中文語句分析方法是通過以下技術方案實現(xiàn)的,具體包括:

A、語句預處理步驟:采用詞法與語法分析工具對語句進行分詞、詞性標注、依存句法分析的預處理;

B、基于事件的中文語句分析步驟:對預處理后的語句進行基于事件的中文語句分析;

C、添加標簽與功能說明步驟:對分析后的語句添加標簽和功能說明,標注對象包括事件指示詞、事件角色和非事件角色三塊主要成分。

上述步驟A所述的語句預處理,采用哈爾濱工業(yè)大學社會計算與信息檢索研究中心提供的語言技術平臺LTP對語句進行分詞、詞性標注(采用中國國家863評測用詞性標記集)、依存句法分析處理。機器處理后的語句以詞為單位標注有詞號、詞性、依存關系信息。

上述步驟B所述的基于事件結構的中文語句分析,對預處理后的語句進行基于事件結構的中文語句分析,包括:確定語句中的事件指示詞、確定各事件指示詞的事件要素、確定修飾事件指示詞與事件角色的修飾成分、確定多身份句子成分、確定其它句子成分,具體步驟如下:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學;國際竹藤中心,未經(jīng)上海大學;國際竹藤中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210439007.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久综合二区| 午夜无遮挡| 欧美日韩国产91| 在线精品国产一区二区三区88| 韩漫无遮韩漫免费网址肉| 欧美在线一区二区视频| 亚洲精品456| 69xx国产| 在线国产91| 国产天堂第一区| 久久亚洲综合国产精品99麻豆的功能介绍| 久久一级精品| 亚洲精品20p| 精品国产一区二区三区四区vr| 欧美系列一区| 国产一区二区免费在线| 国产精品99999999| 国产精品欧美一区二区三区奶水| 少妇高潮ⅴideosex| 91精品国产综合久久婷婷香| 大伊人av| 国内精品国产三级国产99| 午夜精品999| 午夜天堂电影| 午夜精品一区二区三区在线播放| 亚洲四区在线| 色综合久久精品| 国产精品99久久久久久宅男| 99国产精品久久久久99打野战| 91免费国产| 国产精品国外精品| 国产亚洲另类久久久精品| 少妇**毛片| 国产在线不卡一区| 精品国产一区在线| 国产精品久久久久久久久久久不卡| 国产呻吟久久久久久久92| 美女销魂免费一区二区| 91看黄网站| 精品一区二区三区影院| 久久两性视频| 26uuu亚洲电影在线观看| 久久精品一二三四| 四虎国产精品永久在线国在线 | 午夜在线看片| 偷拍精品一区二区三区| 搡少妇在线视频中文字幕| 午夜毛片在线观看| 欧美性受xxxx狂喷水| 日韩av在线播| 视频一区二区三区中文字幕| 爽妇色啪网| 国产精品视频1区2区3区| 中文字幕在线一区二区三区| 国产一区二三| 欧美午夜羞羞羞免费视频app| 亚洲视频h| 久久国产中文字幕| 91精品一区二区在线观看| 女女百合互慰av| 国产高清不卡一区| 日韩av在线网| 欧美日韩一级在线观看| 欧美日韩精品中文字幕| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 国产91刺激对白在线播放| 亚洲欧美色一区二区三区| 国产日韩欧美91| 久久久久国产精品www| 国产亚洲精品精品国产亚洲综合| 日本久久丰满的少妇三区| 欧美一区二区免费视频| 亚洲福利视频一区| 亚洲高清久久久| 挺进警察美妇后菊| 欧美日韩一区二区三区69堂| 精品一区电影国产| 国产日韩一区在线| 日韩精品一区二区亚洲| 精品国产一区二区三区高潮视 | 国产三级国产精品国产专区50| 亚洲一区中文字幕|