[發(fā)明專利]基于神經(jīng)網(wǎng)絡(luò)的中文比較句識(shí)別方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201410264137.8 | 申請(qǐng)日: | 2014-06-13 |
| 公開(公告)號(hào): | CN104021115A | 公開(公告)日: | 2014-09-03 |
| 發(fā)明(設(shè)計(jì))人: | 馮沖;廖純;張辰;楊森 | 申請(qǐng)(專利權(quán))人: | 北京理工大學(xué) |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100081 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 神經(jīng)網(wǎng)絡(luò) 中文 比較 識(shí)別 方法 裝置 | ||
1.一種基于神經(jīng)網(wǎng)絡(luò)的中文比較句識(shí)別方法,其特征在于規(guī)則與統(tǒng)計(jì)相結(jié)合,充分考慮了語(yǔ)義句法信息,包括以下步驟:?
步驟1:對(duì)語(yǔ)料進(jìn)行預(yù)處理,包括如下過程:對(duì)語(yǔ)料集S的每一個(gè)句子進(jìn)行分詞、句法結(jié)構(gòu)分析、依存關(guān)系分析和詞性標(biāo)注、語(yǔ)義角色標(biāo)注;?
步驟2:進(jìn)行句法結(jié)構(gòu)模板抽取,過程如下:將S中每一個(gè)句子的句法結(jié)構(gòu)分析樹與句法結(jié)構(gòu)模板進(jìn)行匹配,如果匹配成功,則判斷其屬于顯性比較句,本步驟中提取得到的顯性比較句的結(jié)果記為集合A;?
步驟3:進(jìn)行依存關(guān)系相似度計(jì)算,過程如下:將步驟二中抽取之后的剩余語(yǔ)料集S-A中的每一個(gè)句子進(jìn)行依存關(guān)系相似度計(jì)算,得到相似度s,并將s與預(yù)設(shè)的閾值v進(jìn)行比較,如果s>=v,則判斷其屬于隱性比較句;否則,判斷其屬于非比較句;本步驟中提取得到的隱性比較句的結(jié)果記為集合B,非比較句的結(jié)果記為集合D;?
步驟4:利用經(jīng)訓(xùn)練的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類,過程如下:將集合A和集合B作為粗粒度提取結(jié)果置于經(jīng)過訓(xùn)練的BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行細(xì)粒度提取,得到比較句集合C和非比較句集合E,BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練特征為:類別序列規(guī)則(Class?Sequential?Rules,CSR)、語(yǔ)義角色標(biāo)注(Semantic?Role?Labeling,SRL)、比較特征詞(Keyword)以及統(tǒng)計(jì)詞特征(Statistical?Word?Feature,SWF)這四種;?
步驟4:識(shí)別完成:輸出識(shí)別結(jié)果比較句集合C和非比較句集合D+E。?
2.根據(jù)權(quán)利要求1所述的一種基于神經(jīng)網(wǎng)絡(luò)的中文比較句識(shí)別方法,其特征在于規(guī)則與統(tǒng)計(jì)相結(jié)合,充分考慮了語(yǔ)義句法信息,所述句法結(jié)構(gòu)模板如下:?
1)SS1=...VP...+(Keywords/Key?Phrases)+...VA...?
此模式(SS1)含義為:句子中出現(xiàn)了比較特征詞(Keywords/Key?Phrases),且此特征詞父節(jié)點(diǎn)的祖先節(jié)點(diǎn)存在動(dòng)詞短語(yǔ)(VP),其父節(jié)點(diǎn)的子節(jié)點(diǎn)(即其兄弟節(jié)點(diǎn))中存在表語(yǔ)形容詞(VA);?
2)SS2=...VP...+(Keywords/Key?Phrases)+...ADJP...?
此模式(SS2)含義為:句子中出現(xiàn)了比較特征詞(Keywords/Key?Phrases),且此特征詞父節(jié)點(diǎn)的祖先節(jié)點(diǎn)存在動(dòng)詞短語(yǔ)(VP),其父節(jié)點(diǎn)的子節(jié)點(diǎn)(即其兄弟節(jié)點(diǎn))中存在形容詞短語(yǔ)(ADJP);?
3)SS3=...VP...+(Keywords/Key?Phrases)+...ADVP...?
此模式(SS3)含義為:句子中出現(xiàn)了比較特征詞(Keywords/Key?Phrases),且此特征詞父節(jié)點(diǎn)的祖先節(jié)點(diǎn)存在動(dòng)詞短語(yǔ)(VP),其父節(jié)點(diǎn)的子節(jié)點(diǎn)(即其兄弟節(jié)點(diǎn))中存在副詞短語(yǔ)(ADVP);?
4)SS4=...NP...+(Keywords/Key?Phrases)+...NP...?
此模式(SS4)含義為:句子中出現(xiàn)了比較特征詞(Keywords/Key?Phrases),且此特征詞父節(jié)點(diǎn)的祖先節(jié)點(diǎn)存在名詞短語(yǔ)(NP),其父節(jié)點(diǎn)的子節(jié)點(diǎn)(即其兄弟節(jié)點(diǎn))中存在名詞短語(yǔ)(NP)。?
5)SS5=...NP...+(Keywords/Key?Phrases)+...ADJP...?
此模式(SS5)含義為:句子中出現(xiàn)了比較特征詞(Keywords/Key?Phrases),且此特征詞父節(jié)點(diǎn)的祖先節(jié)點(diǎn)存在名詞短語(yǔ)(NP),其父節(jié)點(diǎn)的子節(jié)點(diǎn)(即其兄弟節(jié)點(diǎn))中存在形容詞短語(yǔ)(ADJP)。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京理工大學(xué),未經(jīng)北京理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410264137.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





