[發(fā)明專利]一種基于概率潛語義分析模型的面向?qū)ο笥跋窬垲惙椒?/span>有效

申請?zhí)枺?/td>	201010220330.3	申請日：	2010-07-07
公開（公告）號：	CN102314610A	公開（公告）日：	2012-01-11
發(fā)明（設(shè)計(jì)）人：	唐宏;陳云浩;易文斌	申請（專利權(quán)）人：	北京師范大學(xué)
主分類號：	G06K9/62	分類號：	G06K9/62
代理公司：	北京太兆天元知識產(chǎn)權(quán)代理有限責(zé)任公司 11108	代理人：	張韜
地址：	100875 北京市新街口***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于概率語義分析模型面向對象影像方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及圖像分析領(lǐng)域，尤其是涉及一種遙感影像處理的方法。

背景技術(shù)

潛語義分析模型(Latent?Semantic?Analysis，LSA)是一種自然語言分析技術(shù)，由Deerwester等人于年1990提出。該模型認(rèn)為通過分析文檔與詞的共生矩陣，可較好地提取文檔對應(yīng)的語義信息。在實(shí)際文檔識別與檢索應(yīng)用中，文檔與詞之間的語義信息一般通過概率主題來表示，在此基礎(chǔ)上從而形成一系列的概率主題模型。一般而言，概率主題模型均擁有一個(gè)共同的理論前提，即每個(gè)文檔均是由多個(gè)主題依據(jù)不同的比例混合構(gòu)成的，但是不同的概率主題模型對于文檔或主題的先驗(yàn)分布擁有不同的統(tǒng)計(jì)分布假設(shè)，從而適用于不同的分析目標(biāo)。

由于概率主題模型可較好的分析文檔、主題以及詞之間的統(tǒng)計(jì)相關(guān)關(guān)系，該類模型在計(jì)算機(jī)視覺、模式識別等領(lǐng)域均有較好的應(yīng)用，在自然圖像識別、檢索、場景分析中有著較成功的應(yīng)用案例。與此同時(shí)，在高分辨率遙感影像的分類研究中，影像、像元以及像元的歸屬類別之間的關(guān)系，與概率主題模型求解的問題極為相似，存在一定天然的關(guān)聯(lián)關(guān)系，可嘗試將該模型應(yīng)用于遙感影像分類研究。目前使用較多的概率主題模型為概率潛語義分析(PLSA)模型與潛Dirichlet分析(LDA)模型，在不同的實(shí)際應(yīng)用過程中也發(fā)展出了一系列的擴(kuò)展模型。

自然語言處理往往需要分析隱含于詞背后的涵義，普通的詞頻分析方法不能取得較好的結(jié)果，而潛語義分析模型(LSA)通過利用奇異值分解將高維的詞-文檔共生矩陣映射至低維的語義空間，從而體現(xiàn)出深層次語義關(guān)系。Hofmann在LSA模型的基礎(chǔ)上，構(gòu)建了概率潛語義分析模型(PLSA)，擁有更堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ)及易于利用的數(shù)據(jù)生成模型，可為信息提供更好的語義分析。PLSA模型分析的對象為文檔與詞匯的共生矩陣。若假設(shè)該矩陣由有M個(gè)文檔，N個(gè)詞的詞匯表構(gòu)成，則共生矩陣集可被視為一個(gè)M×N的矩陣。該共生矩陣中的任何一個(gè)文檔可視為文檔集D＝{d₁，d₂，…，d_M}中的一個(gè)數(shù)據(jù)，任何一個(gè)詞均可視為詞匯集W＝{w₁，w₂，…，w_N}中的一個(gè)數(shù)據(jù)。共生矩陣中每一個(gè)文檔與每一個(gè)詞的語義關(guān)系需要通過一個(gè)主題來聯(lián)系起來，這個(gè)主題可被視為潛變量集Z＝{z₁，z₂，…，z_K}中的一個(gè)數(shù)據(jù)。PLSA模型是通過文檔與詞的共生矩陣來分析文檔集、詞匯集與潛變量集之間的關(guān)聯(lián)關(guān)系，從而獲取文檔與詞的語義信息。在PLSA模型中，文檔、潛變量及詞的概率生成模型通常可定義為：

·文檔d_i歸屬于文檔集D的概率為P(d_i)；

·文檔d_i中潛變量z_k的條件概率為P(z_k/d_i)；

·文檔d_i中潛變量z_k對應(yīng)詞w_j的條件概率為P(w_j/z_k)；

將概率生成模型中的條件概率可轉(zhuǎn)換一定的聯(lián)合概率模型，具體公式如式(1)與(2)所示。

P(d_i，w_j)＝P(d_i)P(w_j/d_i)?????????????????????????????????????????????(1)

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京師范大學(xué)，未經(jīng)北京師范大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201010220330.3/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06K 數(shù)據(jù)識別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的，例如，由不同形狀的各個(gè)筆畫組成的，而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理，即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】