[發(fā)明專利]一種基于概率潛語義分析模型的面向?qū)ο笥跋窬垲惙椒?/span>有效
| 申請?zhí)枺?/td> | 201010220330.3 | 申請日: | 2010-07-07 |
| 公開(公告)號: | CN102314610A | 公開(公告)日: | 2012-01-11 |
| 發(fā)明(設(shè)計(jì))人: | 唐宏;陳云浩;易文斌 | 申請(專利權(quán))人: | 北京師范大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京太兆天元知識產(chǎn)權(quán)代理有限責(zé)任公司 11108 | 代理人: | 張韜 |
| 地址: | 100875 北京市新街口*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 概率 語義 分析 模型 面向 對象 影像 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像分析領(lǐng)域,尤其是涉及一種遙感影像處理的方法。
背景技術(shù)
潛語義分析模型(Latent?Semantic?Analysis,LSA)是一種自然語言分析技術(shù),由Deerwester等人于年1990提出。該模型認(rèn)為通過分析文檔與詞的共生矩陣,可較好地提取文檔對應(yīng)的語義信息。在實(shí)際文檔識別與檢索應(yīng)用中,文檔與詞之間的語義信息一般通過概率主題來表示,在此基礎(chǔ)上從而形成一系列的概率主題模型。一般而言,概率主題模型均擁有一個(gè)共同的理論前提,即每個(gè)文檔均是由多個(gè)主題依據(jù)不同的比例混合構(gòu)成的,但是不同的概率主題模型對于文檔或主題的先驗(yàn)分布擁有不同的統(tǒng)計(jì)分布假設(shè),從而適用于不同的分析目標(biāo)。
由于概率主題模型可較好的分析文檔、主題以及詞之間的統(tǒng)計(jì)相關(guān)關(guān)系,該類模型在計(jì)算機(jī)視覺、模式識別等領(lǐng)域均有較好的應(yīng)用,在自然圖像識別、檢索、場景分析中有著較成功的應(yīng)用案例。與此同時(shí),在高分辨率遙感影像的分類研究中,影像、像元以及像元的歸屬類別之間的關(guān)系,與概率主題模型求解的問題極為相似,存在一定天然的關(guān)聯(lián)關(guān)系,可嘗試將該模型應(yīng)用于遙感影像分類研究。目前使用較多的概率主題模型為概率潛語義分析(PLSA)模型與潛Dirichlet分析(LDA)模型,在不同的實(shí)際應(yīng)用過程中也發(fā)展出了一系列的擴(kuò)展模型。
自然語言處理往往需要分析隱含于詞背后的涵義,普通的詞頻分析方法不能取得較好的結(jié)果,而潛語義分析模型(LSA)通過利用奇異值分解將高維的詞-文檔共生矩陣映射至低維的語義空間,從而體現(xiàn)出深層次語義關(guān)系。Hofmann在LSA模型的基礎(chǔ)上,構(gòu)建了概率潛語義分析模型(PLSA),擁有更堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ)及易于利用的數(shù)據(jù)生成模型,可為信息提供更好的語義分析。PLSA模型分析的對象為文檔與詞匯的共生矩陣。若假設(shè)該矩陣由有M個(gè)文檔,N個(gè)詞的詞匯表構(gòu)成,則共生矩陣集可被視為一個(gè)M×N的矩陣。該共生矩陣中的任何一個(gè)文檔可視為文檔集D={d1,d2,…,dM}中的一個(gè)數(shù)據(jù),任何一個(gè)詞均可視為詞匯集W={w1,w2,…,wN}中的一個(gè)數(shù)據(jù)。共生矩陣中每一個(gè)文檔與每一個(gè)詞的語義關(guān)系需要通過一個(gè)主題來聯(lián)系起來,這個(gè)主題可被視為潛變量集Z={z1,z2,…,zK}中的一個(gè)數(shù)據(jù)。PLSA模型是通過文檔與詞的共生矩陣來分析文檔集、詞匯集與潛變量集之間的關(guān)聯(lián)關(guān)系,從而獲取文檔與詞的語義信息。在PLSA模型中,文檔、潛變量及詞的概率生成模型通常可定義為:
·文檔di歸屬于文檔集D的概率為P(di);
·文檔di中潛變量zk的條件概率為P(zk/di);
·文檔di中潛變量zk對應(yīng)詞wj的條件概率為P(wj/zk);
將概率生成模型中的條件概率可轉(zhuǎn)換一定的聯(lián)合概率模型,具體公式如式(1)與(2)所示。
P(di,wj)=P(di)P(wj/di)?????????????????????????????????????????????(1)
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京師范大學(xué),未經(jīng)北京師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010220330.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:建筑支架管端護(hù)套
- 下一篇:室內(nèi)墻面裝飾板
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 面向語義Web服務(wù)程序設(shè)計(jì)的語義數(shù)據(jù)表示和處理方法
- 一種基于語義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語義匹配方法和系統(tǒng)
- 遠(yuǎn)程語義識別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲介質(zhì)
- 一種基于語義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級語義表征和語義計(jì)算的信號語義識別方法
- 語義分類方法及裝置、存儲介質(zhì)及電子設(shè)備





