[發(fā)明專利]基于多模型優(yōu)勢互補策略的介詞短語識別方法在審
| 申請?zhí)枺?/td> | 201710877036.1 | 申請日: | 2017-09-25 |
| 公開(公告)號: | CN107741927A | 公開(公告)日: | 2018-02-27 |
| 發(fā)明(設計)人: | 周俏麗 | 申請(專利權(quán))人: | 沈陽航空航天大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 沈陽優(yōu)普達知識產(chǎn)權(quán)代理事務所(特殊普通合伙)21234 | 代理人: | 李曉光 |
| 地址: | 110136 遼寧省沈*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 模型 優(yōu)勢互補 策略 介詞 短語 識別 方法 | ||
1.一種基于多模型優(yōu)勢互補策略的介詞短語識別方法,其特征在于包括以下步驟:
1)對介詞短語進行分類,根據(jù)上下文特征對介詞進行分類,介詞短語的句子成分和位置特性,對介詞短語的特點進行分析總結(jié),得到不同類別對應的位置特征;
2)針對不同的類別選擇不同的位置特征組合,采用條件隨機場模型對介詞短語進行識別,選擇訓練語料特征;
3)針對選擇的訓練語料特征訓練多個介詞短語識別模型,將句子中的各個介詞的識別結(jié)果進行合并,獲得最終結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于多模型優(yōu)勢互補策略的介詞短語識別方法,其特征在于對介詞短語分類如下:
101)介詞短語的為狀語:
當在主語之前時,和主句之間有一個停頓;
出現(xiàn)在主語之后和動詞之前的介詞短語狀語,與動詞有密切的關(guān)系,且緊鄰;
102)介詞短為定語:
介詞短語充當定語帶“的”,作定語的介詞短語位于“的”之前;
103)介詞短語充當補語格式為“V+介詞+NP”。
3.根據(jù)權(quán)利要求1所述的基于多模型優(yōu)勢互補策略的介詞短語識別方法,其特征在于針對不同的類別選擇不同的特征組合,采用條件隨機場模型對介詞短語進行識別,選擇訓練語料特征為:
201)針對不同的類別選擇不同的特征組合,訓練多個PP識別模型,對識別的標注集進行選擇;
202)根據(jù)選擇的標注集生成多模型優(yōu)勢互補表,基于優(yōu)勢互補表對多個模型的識別結(jié)果進融合;
203)根據(jù)多模型優(yōu)勢互補表選擇介詞對應模型的識別結(jié)果。
步驟204),將語料分為訓練集,開發(fā)集和測試集。訓練集用來訓練模型,開發(fā)集用來調(diào)試參數(shù),測試集用來測試。
4.根據(jù)權(quán)利要求3所述的基于多模型優(yōu)勢互補策略的介詞短語識別方法,其特征在于:
基于優(yōu)勢互補表對多個模型的識別結(jié)果進融合包括以下過程:首先分析不同類型的介詞短語的上下文位置特征,然后訓練多個模型,再生成多模型優(yōu)勢互補策略,即基于優(yōu)勢互補表對多個模型的識別結(jié)果進行優(yōu)勢整合。
5.根據(jù)權(quán)利要求3所述的基于多模型優(yōu)勢互補策略的介詞短語識別方法,其特征在于優(yōu)勢互補表通過以下步驟生成:
基于特征組合對訓練語料訓練3個模型,然后用這3個模型同時在測試集上做測試,再針對3個模型的結(jié)果進行分析,并生成優(yōu)勢互補表。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于沈陽航空航天大學,未經(jīng)沈陽航空航天大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710877036.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種計算機網(wǎng)絡策略管理系統(tǒng)及策略管理方法
- 應用于合法監(jiān)聽系統(tǒng)的網(wǎng)絡策略架構(gòu)及其策略處理方法
- 分發(fā)策略的方法、系統(tǒng)和策略分發(fā)實體
- 策略控制方法、策略規(guī)則決策設備和策略控制設備
- 用于控制QoS策略沖突的方法、設備和系統(tǒng)
- 策略融合的方法、UE及服務器
- 策略調(diào)整觸發(fā)、策略調(diào)整方法及裝置、策略調(diào)整系統(tǒng)
- 設備策略管理器
- 策略組中的策略評估、策略選擇方法及裝置
- 策略集群分發(fā)匹配方法、系統(tǒng)及計算機可讀存儲介質(zhì)





