[發(fā)明專利]一種用于Web對(duì)象信息抽取的增強(qiáng)約束條件隨機(jī)場(chǎng)模型在審
| 申請(qǐng)?zhí)枺?/td> | 201410126652.X | 申請(qǐng)日: | 2014-03-31 |
| 公開(公告)號(hào): | CN103870596A | 公開(公告)日: | 2014-06-18 |
| 發(fā)明(設(shè)計(jì))人: | 梁久禎;黃彥姣 | 申請(qǐng)(專利權(quán))人: | 江南大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 214122 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 web 對(duì)象 信息 抽取 增強(qiáng) 約束條件 隨機(jī) 模型 | ||
1.一種用于Web對(duì)象信息抽取的增強(qiáng)約束條件隨機(jī)場(chǎng)模型,其特征在于,所述方法包括:?
給定一個(gè)線性鏈條件隨機(jī)場(chǎng)G=(X,Y),X是觀測(cè)序列隨機(jī)變量,Y是狀態(tài)標(biāo)注序列隨機(jī)變量,將可信約束條件c引入條件隨機(jī)場(chǎng)形成約束條件隨機(jī)場(chǎng),使用最大似然參數(shù)估計(jì)方法來對(duì)模型進(jìn)行訓(xùn)練,通過對(duì)狀態(tài)標(biāo)注序列與正確序列比較后的正確率測(cè)度A(Y,Yr)以及增強(qiáng)因子b對(duì)約束條件隨機(jī)場(chǎng)進(jìn)行增強(qiáng),計(jì)算出標(biāo)注序列Y的概率分布p(Y|X,c);?
計(jì)算出標(biāo)注序列Y的概率分布后,將可信約束條件c引入條件隨機(jī)場(chǎng)的Viterbi推理過程,根據(jù)約束條件c約束一些特定的數(shù)據(jù)元素取某些指定的屬性標(biāo)簽,以提高Web數(shù)據(jù)屬性標(biāo)注的性能。?
2.根據(jù)權(quán)利要求1所述的計(jì)算標(biāo)注序列Y的概率分布,在下列公式我們引入線性鏈條件隨機(jī)場(chǎng)的概率分布:?
對(duì)于概率分布的計(jì)算,其特征在于,所述的概率分布p(Y|X,c),將可信約束條件c引入條件隨機(jī)場(chǎng)形成約束條件隨機(jī)場(chǎng)得到:?
其中,Z(Xr,c)為歸一化因子,為狀態(tài)標(biāo)注序列Y相對(duì)于正確序列Yr的正確率測(cè)度,它表示狀態(tài)標(biāo)注序列Y中標(biāo)注正確的元素個(gè)數(shù),fk(Y,X,c)為全局特征向量,wk為特征向量的權(quán)重,從模型的訓(xùn)練樣本中估計(jì)得到,可信約束條件c通過構(gòu)建可信約束矩陣來表示具有某個(gè)特征的數(shù)據(jù)元素被標(biāo)注成相應(yīng)標(biāo)簽的概率,從而約束小概率事件的發(fā)生。?
3.根據(jù)權(quán)利要求2所述的概率分布的計(jì)算,對(duì)所述的歸一化因子Z(Xr,c)的計(jì)算,其特征在于,所述方法中,Z(Xr,c)可以在所有可能的輸出序?列Y上求和的基礎(chǔ)上,引入約束條件、增強(qiáng)因子和正確率測(cè)度得到,即?
其中,b為增強(qiáng)因子,由經(jīng)驗(yàn)值決定。A(Y,Yr)為狀態(tài)標(biāo)注序列Y相對(duì)于正確序列Yr的正確率測(cè)度,fk(Y,X,c)為全局特征向量,wk為特征向量的權(quán)重;?
歸一化因子Z(Xr,c)是在全局條件下定義的,即對(duì)所有特征進(jìn)行全局歸一化,從而計(jì)算出全局最優(yōu)輸出序列的條件概率,能很好的解決標(biāo)記偏置問題。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江南大學(xué),未經(jīng)江南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410126652.X/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:無電池膠囊內(nèi)窺鏡
- 下一篇:電動(dòng)洗碗刷
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 提供共享Web模塊的系統(tǒng)和方法
- 管理環(huán)球網(wǎng)網(wǎng)頁中的環(huán)球網(wǎng)媒體的系統(tǒng)及其實(shí)現(xiàn)方法
- 一種WEB業(yè)務(wù)實(shí)現(xiàn)系統(tǒng)、裝置及方法
- 高速緩存廣播信息的方法和裝置
- 基于QoS指標(biāo)和Web服務(wù)輸出參數(shù)的Web服務(wù)組合方法和裝置
- Web托管審查方法、裝置及Web托管系統(tǒng)
- 用于信息處理和Web瀏覽歷史導(dǎo)航的方法和設(shè)備及電子裝置
- 用于將web站點(diǎn)轉(zhuǎn)換為目標(biāo)web app站點(diǎn)的方法和裝置
- 用于防護(hù)WEB漏洞的方法和設(shè)備
- 一種Web攻擊報(bào)告生成方法、裝置、設(shè)備及計(jì)算機(jī)介質(zhì)
- 對(duì)象選擇裝置、對(duì)象選擇程序及對(duì)象選擇方法
- 對(duì)象顯示裝置、對(duì)象顯示系統(tǒng)以及對(duì)象顯示方法
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象分析方法、對(duì)象分析設(shè)備及對(duì)象分析系統(tǒng)
- 對(duì)象索引方法、對(duì)象搜索方法及對(duì)象索引系統(tǒng)
- 對(duì)象分類方法和對(duì)象分類設(shè)備
- 對(duì)象庫中的對(duì)象簽名
- 對(duì)象追蹤方法、對(duì)象追蹤系統(tǒng)以及對(duì)象追蹤程序
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





