[發(fā)明專利]一種基于同義詞擴展的貝葉斯詞義消歧方法在審
| 申請?zhí)枺?/td> | 201611157518.1 | 申請日: | 2016-12-15 |
| 公開(公告)號: | CN106598947A | 公開(公告)日: | 2017-04-26 |
| 發(fā)明(設(shè)計)人: | 楊陟卓;張虎;李茹;陳千;譚紅葉 | 申請(專利權(quán))人: | 山西大學(xué) |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06K9/62 |
| 代理公司: | 山西五維專利事務(wù)所(有限公司)14105 | 代理人: | 郭海燕 |
| 地址: | 030006 山*** | 國省代碼: | 山西;14 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 同義詞 擴展 貝葉斯 詞義 方法 | ||
1.一種基于同義詞擴展的貝葉斯詞義消歧方法,其特征在于包括以下步驟:
步驟1、采用同義詞詞林將訓(xùn)練語料庫的上下文進行擴展,生成大量偽訓(xùn)練語料;
步驟2、利用詞語搭配語料庫去除偽訓(xùn)練語料中的噪聲,生成偽訓(xùn)練語料庫;
步驟3、同時采用訓(xùn)練語料庫和偽訓(xùn)練語料庫訓(xùn)練貝葉斯消歧模型;
步驟4、將測試語料輸入貝葉斯消歧模型,綜合利用兩種語料庫中的消歧知識,共同決策歧義詞的詞義。
2.根據(jù)權(quán)利要求1所述的一種基于同義詞擴展的貝葉斯詞義消歧方法,其特征在于:所述步驟1的具體步驟為:首先,采用人工標(biāo)注的方式建立小規(guī)模詞義消歧訓(xùn)練語料庫,然后利用同義詞詞林,對歧義詞所處句子中的上下文進行擴展,最后將擴展后的同義詞、歧義詞以及該句中歧義詞的詞義,生成大量偽訓(xùn)練語料。
3.根據(jù)權(quán)利要求1所述的一種基于同義詞擴展的貝葉斯詞義消歧方法,其特征在于步驟2的具體步驟為:利用同義詞詞林對歧義詞的上下文進行擴展,針對擴展的上下文,統(tǒng)計與歧義詞在詞語搭配語料庫中共現(xiàn)次數(shù),只利用具有一定共現(xiàn)次數(shù)的上下文,構(gòu)建偽訓(xùn)練語料庫。
4.根據(jù)權(quán)利要求1所述的一種基于同義詞擴展的貝葉斯詞義消歧方法,其特征在于:所述步驟3中同時采用訓(xùn)練語料庫和偽訓(xùn)練語料庫訓(xùn)練貝葉斯消歧模型,計算公式為:
公式中,si表示歧義詞詞義,w-L...wL表示歧義詞w0附近一定窗口大小L下的詞語,fj表示歧義詞的某個上下文特征,F(xiàn)表示上下文的特征集合,p(fj|si)表示詞義與特征的條件概率,計算如公式為:
c(si)表示詞義si在語料庫中出現(xiàn)的次數(shù),c(fj,si)表示特征fj與詞義si在訓(xùn)練語料中的共現(xiàn)次數(shù)。
5.根據(jù)權(quán)利要求1所述的一種基于同義詞擴展的貝葉斯詞義消歧方法,其特征在于:所述步驟4的具體步驟為:將由同義詞詞林?jǐn)U展的上下文所組成的語言片段,當(dāng)作偽訓(xùn)練語料,綜合利用訓(xùn)練語料庫和偽訓(xùn)練語料庫中的知識,進行詞義消歧,在估計詞義和特征的條件概率時,由以下公式計算得出:
公式中ct(fj,si)表示詞義si與特征fj在訓(xùn)練語料中的共現(xiàn)次數(shù),ct(si)表示詞義si在訓(xùn)練語料中的出現(xiàn)次數(shù),cp(fj,si)表示特征與歧義詞在偽訓(xùn)練語料中的共現(xiàn)次數(shù),cp(si)表示詞義si在偽訓(xùn)練語料中出現(xiàn)次數(shù),λ取值為0.7。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山西大學(xué),未經(jīng)山西大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611157518.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種自主融合先驗知識的貝葉斯網(wǎng)絡(luò)方法
- 構(gòu)建解決組合爆炸問題的級聯(lián)貝葉斯網(wǎng)絡(luò)的方法
- 一種可重構(gòu)系統(tǒng)貝葉斯網(wǎng)構(gòu)建方法
- 一種基于貝葉斯網(wǎng)絡(luò)的網(wǎng)站缺陷預(yù)測方法及其實現(xiàn)系統(tǒng)
- 應(yīng)用處理方法、裝置、存儲介質(zhì)及電子設(shè)備
- 一種遮擋目標(biāo)檢測方法、電子設(shè)備、存儲介質(zhì)及系統(tǒng)
- 基于貝葉斯網(wǎng)絡(luò)推理模型的犯罪重建方法及裝置
- 利用憶阻器本征噪聲實現(xiàn)貝葉斯神經(jīng)網(wǎng)絡(luò)的方法及裝置
- 基于面向?qū)ο筘惾~斯網(wǎng)絡(luò)的中央空調(diào)系統(tǒng)故障診斷方法
- 一種基于貝葉斯神經(jīng)網(wǎng)絡(luò)權(quán)重約束的圖像分類方法





