[發(fā)明專利]基于事件結(jié)構(gòu)的中文語(yǔ)句分析方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201210439007.4 | 申請(qǐng)日: | 2012-11-07 |
| 公開(kāi)(公告)號(hào): | CN103268311A | 公開(kāi)(公告)日: | 2013-08-28 |
| 發(fā)明(設(shè)計(jì))人: | 張旭潔;朱平;劉宗田;劉煒;王東;田垅 | 申請(qǐng)(專利權(quán))人: | 上海大學(xué);國(guó)際竹藤中心 |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27 |
| 代理公司: | 上海上大專利事務(wù)所(普通合伙) 31205 | 代理人: | 何文欣 |
| 地址: | 200444*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 事件 結(jié)構(gòu) 中文 語(yǔ)句 分析 方法 | ||
1.基于事件結(jié)構(gòu)的中文語(yǔ)句分析方法,其特征在于:將一個(gè)中文句子表示為若干事件指示詞和與之對(duì)應(yīng)的事件角色包括非事件相關(guān)成分的樹形結(jié)構(gòu),事件結(jié)構(gòu)的中文語(yǔ)句分析具體操作步驟如下:
A、語(yǔ)句預(yù)處理:采用詞法與語(yǔ)法分析工具對(duì)語(yǔ)句進(jìn)行分詞、詞性標(biāo)注、依存句法分析的預(yù)處理;
B、基于事件的中文語(yǔ)句分析:對(duì)預(yù)處理后的語(yǔ)句進(jìn)行基于事件的中文語(yǔ)句分析;找出語(yǔ)句中的事件指示詞和與之對(duì)應(yīng)的事件角色,分析多角色成分和非事件相關(guān)成分;
C、添加標(biāo)簽與功能說(shuō)明:對(duì)分析后的語(yǔ)句添加標(biāo)簽和功能說(shuō)明,標(biāo)注對(duì)象包括事件指示詞、事件角色和非事件角色三塊主要成分,給出樹形表示結(jié)構(gòu)的括號(hào)表示形式。
2.根據(jù)權(quán)利要求1所述的基于事件結(jié)構(gòu)的中文語(yǔ)句分析方法,其特征在于:所述步驟A所述的語(yǔ)句預(yù)處理的具體操作方法如下:
采用哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索研究中心提供的語(yǔ)言技術(shù)平臺(tái)LTP2.1對(duì)語(yǔ)句進(jìn)行分詞、詞性標(biāo)注——采用中國(guó)國(guó)家863評(píng)測(cè)用詞性標(biāo)記集、依存句法分析處理,機(jī)器處理后的語(yǔ)句標(biāo)注語(yǔ)句號(hào),單詞號(hào),同時(shí)標(biāo)記了每個(gè)單詞的詞性和依存關(guān)系。
3.根據(jù)權(quán)利要求1所述的基于事件結(jié)構(gòu)的中文語(yǔ)句分析方法,其特征在于,所述步驟B所述的基于事件的中文語(yǔ)句分析的具體實(shí)施步驟如下:
B1、確定語(yǔ)句中的事件指示詞:找出句子中的所有動(dòng)詞與事件專有名詞,對(duì)動(dòng)詞進(jìn)行分類,動(dòng)詞類型包括實(shí)意動(dòng)詞和抽象動(dòng)詞,分析各動(dòng)詞的依存關(guān)系,如果動(dòng)詞的依存關(guān)系為定中關(guān)系(ATT)或者幾個(gè)動(dòng)詞為并列關(guān)系(COO)其中一個(gè)動(dòng)詞的依存關(guān)系為ATT則這些動(dòng)詞為修飾成分,其余的事件專有名詞和動(dòng)詞均為事件指示詞,下面對(duì)確定語(yǔ)句中事件指示詞的說(shuō)明:
B11、事件專有名詞
事件專有名詞是一類特殊的名詞,在語(yǔ)句中表示了某個(gè)事件的發(fā)生;?
B12、實(shí)意動(dòng)詞
實(shí)意動(dòng)詞即一般動(dòng)詞,用來(lái)表示動(dòng)作或行為本身,具備動(dòng)詞的主要語(yǔ)法特征,是典型的動(dòng)詞;?
B13抽象動(dòng)詞
抽象動(dòng)詞即實(shí)意動(dòng)詞之外其它類型的動(dòng)詞;?
B14依存關(guān)系為ATT起修飾作用的動(dòng)詞
依存關(guān)系為定中關(guān)系A(chǔ)TT的動(dòng)詞表示該動(dòng)詞在句子中做修飾成分,不作為事件指示詞來(lái)考慮;同樣幾個(gè)動(dòng)詞為并列關(guān)系COO其中一個(gè)動(dòng)詞的依存關(guān)系為ATT,表示這幾個(gè)動(dòng)詞同為修飾成分;?
B2、確定各事件指示詞的事件角色:通過(guò)分析找到對(duì)應(yīng)每個(gè)事件指示詞的事件角色即施事者、受事者、環(huán)境、時(shí)間、工具,并把一個(gè)句子中充當(dāng)多個(gè)事件指示詞的不同或相同事件要素部分找出來(lái);?
B21、事件角色施事者
施事者即動(dòng)作的主體,表示施加動(dòng)作的人或物;
B22、事件角色受事者
受事者即動(dòng)作的客體,表示受動(dòng)作支配的人或物;?
B23、事件角色環(huán)境
環(huán)境即描述動(dòng)作發(fā)生的地點(diǎn)、位置等信息;?
B24、事件角色時(shí)間
時(shí)間即描述動(dòng)作發(fā)生的時(shí)間,可以是絕對(duì)時(shí)間、相對(duì)時(shí)間或時(shí)間區(qū)間;?
B25、事件角色工具
工具即動(dòng)作所采用的工具;?
B26、多身份事件角色
多身份事件角色即句子中的某一部分內(nèi)容同時(shí)充當(dāng)不同事件指示詞所對(duì)應(yīng)的事件角色;?
B3、確定修飾事件指示詞與事件角色的修飾成分:通過(guò)語(yǔ)義分析與依存關(guān)系分析找出具有修飾含義的部分,通常情況下主要考察依存關(guān)系為定中關(guān)系A(chǔ)TT、數(shù)量關(guān)系QUN、語(yǔ)態(tài)結(jié)構(gòu)MT、“的”字結(jié)構(gòu)DE、“地”字結(jié)構(gòu)DI、狀中結(jié)構(gòu)ADV的詞語(yǔ),并且再次確定修飾成分中是否包括已分析過(guò)的事件角色,如果包括,則該修飾成分為多角色部分;?
B4、確定其它句子成分:通過(guò)以上分析后句子中剩余的成分有介詞、連詞、習(xí)語(yǔ)、感嘆詞、擬聲詞、詞素、非詞匯單位和標(biāo)點(diǎn)符號(hào);除介詞與連詞外其它成分暫不做處理;對(duì)介詞和連詞的功能分析即對(duì)其進(jìn)行分類;介詞分為表示時(shí)間、處所、方向、方式、方法、依據(jù)、工具、比較、原因、目的、施事、受事、關(guān)涉對(duì)象和其它共14種類型;連詞分為并列、承接、轉(zhuǎn)折、因果、選擇、假設(shè)、比較、讓步、遞進(jìn)、條件、目的和其它共12中連詞。
4.根據(jù)權(quán)利要求1所述的基于事件結(jié)構(gòu)的中文語(yǔ)句分析方法,其特征在于,所述步驟C中所述的添加標(biāo)簽與功能說(shuō)明,所有標(biāo)記的標(biāo)記格式均采用XML語(yǔ)言,其具體實(shí)施步驟如下:
C1、標(biāo)記多角色句子成分:根據(jù)步驟B的分析結(jié)果,首先將多角色句子成分標(biāo)記出來(lái),其標(biāo)簽為“MC”,然后添加多角色句子成分編號(hào)“mcID”,其中ID為一個(gè)自然數(shù);
C2、標(biāo)記事件角色成分:根據(jù)步驟B的分析結(jié)果,逐一標(biāo)記多角色成分中的各事件角色成分和編號(hào),然后標(biāo)記其它事件角色和編號(hào);如句子中不存在多角色成分則直接標(biāo)記各事件角色成分和編號(hào);
事件指示詞的編號(hào)“eID”中的ID號(hào)由事件指示詞的類型和在依存關(guān)系樹中的深度來(lái)確定,其優(yōu)先級(jí)規(guī)則是:事件專有名詞>動(dòng)詞1即依存樹1層>動(dòng)詞2即依存樹2層…>動(dòng)詞n即依存書葉子節(jié)點(diǎn),如果幾個(gè)動(dòng)詞同在一層則按照從左到右的順序排列;除事件指示詞外,其它事件角色的編號(hào)由其所對(duì)應(yīng)的事件指示詞的編號(hào)來(lái)確定,除了標(biāo)記事件角色的標(biāo)簽和編號(hào)外,還要標(biāo)記一些功能說(shuō)明,具體標(biāo)記內(nèi)容說(shuō)明如下:
C21、<subject(施事者標(biāo)簽)?sid(編號(hào))=sID?t_subject(類型)=creature(人或生物)|things(物)|organization(組織機(jī)構(gòu))|phrase(短語(yǔ))|clause(短句)|?event(事件)>?</subject>(結(jié)束標(biāo)志)
C22、<object(受事者標(biāo)簽)?oid(編號(hào))=oID?t_object(類型)=creature(人或生物)|things(物)|organization(組織機(jī)構(gòu))|?phrase(短語(yǔ))|clause(短句)|?event(事件)?>?</object>(結(jié)束標(biāo)志)
C23、<denote(事件指示詞標(biāo)簽)?eid(編號(hào))=eID?t_denote(類型)=event_v(實(shí)意動(dòng)詞)|sense_v(抽象動(dòng)詞)|event_n(事件專有名詞)?tendency(動(dòng)詞類型傾向)=?VX(判斷動(dòng)詞)|VM(心理動(dòng)詞)?|VD(趨向動(dòng)詞)|VO(能愿動(dòng)詞)|VF(使令動(dòng)詞)|VV(表白動(dòng)詞)|VA(行止動(dòng)詞)|VM(比你比擬動(dòng)詞)|VE(一般動(dòng)詞)|?proprietary?(事件專有詞)?performance(動(dòng)作完成情況)=happen(已經(jīng)發(fā)生)|unhappen(未發(fā)生)|happing(正在發(fā)生)?wordtime(動(dòng)作事件)=bygone(過(guò)去)|now(現(xiàn)在)|future將來(lái)>?</denote>(結(jié)束標(biāo)志)
C24、<time(時(shí)間標(biāo)簽)?tid(編號(hào))=tID?t_time(類型)=absTime(絕對(duì)時(shí)間)|relTime(相對(duì)時(shí)間)|timeInterval(時(shí)間區(qū)間)>?</time>(結(jié)束標(biāo)志)
C25、<locotr(環(huán)境標(biāo)簽)?lid(編號(hào))=lID?t_loctor(類型)=origin(出發(fā)地)|destination(目的地)|place(環(huán)境地點(diǎn))>?</loctor>(結(jié)束標(biāo)志)
C26、<tool(工具標(biāo)簽)?toid(編號(hào))=tID?t_tool(工具類型)=?creature(人或生物)|thing(物)|event(事件)>?</tool>(結(jié)束標(biāo)志)
C3、標(biāo)記非事件角色成分:根據(jù)步驟B的分析結(jié)果,標(biāo)記整個(gè)句子中的非事件角色成分的標(biāo)簽和功能說(shuō)明,具體標(biāo)記內(nèi)容說(shuō)明如下:
C31、<modifier(修飾成分標(biāo)簽)?m_element(修飾的成分)=eID(事件指示詞編號(hào))|sID(施事者編號(hào))|oID(受事著編號(hào))|tID(事件編號(hào))|lID(環(huán)境編號(hào))|toID(工具編號(hào))|mcID(多角色成分編號(hào))?t_modifier(修飾成分類型)=adjective(形容詞)|adverb(副詞)|phrase(短語(yǔ))|clause(短句)|noun(名詞)|verb(動(dòng)詞)|proprietary(專有事件)|?auxiliary(助詞)?|others(其它)?m_appraise(修飾評(píng)價(jià)方向)=commendatory(褒)|pejorative(貶)|neutral(中性)|bygone(過(guò)去)|now(現(xiàn)在)|future(將來(lái))|degree(程度)|quality(質(zhì)量)|quantity(數(shù)量)|time(時(shí)間)|speed(速度)|affiliation(隸屬)|?tense(時(shí)態(tài))?|negative(否定)|?frequentness(頻率)|post(職務(wù))|pattern(方式)|method(方法)……?>?</modifier>(結(jié)束標(biāo)志)
C32、<conjuction(連詞標(biāo)簽)?cid(編號(hào))=cID?s_conjunction(連詞序)=beg(起始連詞)|mid(中間連詞)|end(結(jié)尾連詞)|?single(單一連詞)?t_conjunction(類型)?=coordinating(并列關(guān)系)|continue(承接關(guān)系)|transition(轉(zhuǎn)折關(guān)系)|karma(因果關(guān)系)|select(選擇關(guān)系)|suppose(假設(shè)關(guān)系)|compare(比較關(guān)系)|concession(讓步關(guān)系)|progressive(遞進(jìn)關(guān)系)|conditional(條件關(guān)系)|purpose(目的關(guān)系)></conjuction>(結(jié)束標(biāo)志)
C33、<preposition?(介詞標(biāo)簽)t_prepositon(介詞類型)=time_p(時(shí)間介詞)|loctor_p(處所介詞)|pattern_p(方式介詞)|method_p(方法介詞)|accord_p(依據(jù)介詞)|tool_p(工具介詞)|compare_p(比較介詞)|reason_p(原因介詞)|?objective_p(目的介詞)|subject_p(施事介詞)|object_p(受事介詞)|involve_p(關(guān)涉對(duì)象介詞)>?</preposition>(結(jié)束標(biāo)志)
C34、<others?(其它成分標(biāo)簽)t_others(類型)=idiom(習(xí)慣用語(yǔ))|exelamation(感嘆詞)|onomatopoetic(擬聲詞)|morpheme(語(yǔ)素)|non-lexeme(非詞匯單位)|prefix(前綴)|suffix(后綴)|DE(“的”結(jié)構(gòu))|DI(“地”結(jié)構(gòu))|…>?</others>(結(jié)束標(biāo)志)
C4、基于事件結(jié)構(gòu)的語(yǔ)句分析樹的形式化表示:通過(guò)C1、C2、C3步驟的處理,整個(gè)句子以分析事件的角度將各事件角色和非事件角色成分以樹形結(jié)構(gòu)進(jìn)行描述,最后通過(guò)括號(hào)表示法將基于事件結(jié)構(gòu)的語(yǔ)句分析樹表示出來(lái)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海大學(xué);國(guó)際竹藤中心,未經(jīng)上海大學(xué);國(guó)際竹藤中心許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210439007.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種事件通訊裝置及方法
- 動(dòng)態(tài)權(quán)重事件處理系統(tǒng)和方法
- 攻擊檢測(cè)裝置和攻擊檢測(cè)方法
- 基于Unity的事件管理方法及系統(tǒng)
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 熱點(diǎn)事件確定方法及裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種樹狀模型中節(jié)點(diǎn)的連接方法及其模型、計(jì)算機(jī)裝置和可讀存儲(chǔ)介質(zhì)
- 一種事件處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)





