[發(fā)明專利]本體親和度矩陣的有效計算無效
| 申請?zhí)枺?/td> | 201010117358.4 | 申請日: | 2010-02-12 |
| 公開(公告)號: | CN101807201A | 公開(公告)日: | 2010-08-18 |
| 發(fā)明(設(shè)計)人: | 斯特吉奧斯·斯特吉奧;賈瓦哈拉·賈殷;雅納斯·郎布羅 | 申請(專利權(quán))人: | 富士通株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 李輝 |
| 地址: | 日本神奈*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 本體 親和 矩陣 有效 計算 | ||
1.一種方法,該方法包括以下步驟:
對包括多個反向索引列表的反向索引進(jìn)行訪問,每個反向索引列表對應(yīng)于一個術(shù)語,每個反向索引列表包括該術(shù)語的術(shù)語標(biāo)識符和一個或更多個文檔標(biāo)識符,所述一個或更多個文檔標(biāo)識符指示了文檔集合中的出現(xiàn)所述術(shù)語的一個或更多個文檔;
對多個有序?qū)M(jìn)行組織,各有序?qū)Πǚ聪蛩饕斜淼男g(shù)語標(biāo)識符和文檔標(biāo)識符,所述組織步驟首要地基于所述有序?qū)Φ乃鑫臋n標(biāo)識符;以及
根據(jù)所述反向索引生成術(shù)語標(biāo)識符索引,所述術(shù)語標(biāo)識符索引包括多個片段,每個片段對應(yīng)于一個文檔,每個片段包括所述文檔中出現(xiàn)的一個或更多個術(shù)語的一個或更多個術(shù)語標(biāo)識符,根據(jù)所述反向索引生成所述術(shù)語標(biāo)識符索引的步驟包括以下步驟:對所述術(shù)語標(biāo)識符索引的所述片段中的有序?qū)Φ男g(shù)語標(biāo)識符進(jìn)行組織。
2.根據(jù)權(quán)利要求1所述的方法,其中,對所述多個有序?qū)M(jìn)行組織的步驟還包括以下步驟:
其次地基于所述有序?qū)Φ乃鲂g(shù)語標(biāo)識符對所述有序?qū)M(jìn)行組織。
3.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)所述反向索引生成所述術(shù)語標(biāo)識符索引的步驟還包括以下步驟:
從數(shù)據(jù)結(jié)構(gòu)中按順序選擇有序?qū)Γ灰约?/p>
將所選擇的有序?qū)Φ男g(shù)語標(biāo)識符放置于所述術(shù)語標(biāo)識符索引的與一個文檔相對應(yīng)的片段中,以根據(jù)文檔對所述反向索引的所述術(shù)語標(biāo)識符進(jìn)行組織。
4.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)所述反向索引生成所述術(shù)語標(biāo)識符索引的步驟還包括以下步驟:
從數(shù)據(jù)結(jié)構(gòu)中去除所選擇的有序?qū)Γ?/p>
由所述反向索引生成下一個有序?qū)Γ鱿乱粋€有序?qū)Πㄅc所選擇的有序?qū)Φ男g(shù)語標(biāo)識符等同的術(shù)語標(biāo)識符;以及
將所述下一個有序?qū)Ψ胖糜谒鰯?shù)據(jù)結(jié)構(gòu)中。
5.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)所述反向索引生成所述術(shù)語標(biāo)識符索引的步驟還包括以下步驟:
確定所選擇的有序?qū)Πㄅc之前選擇的有序?qū)Φ奈臋n標(biāo)識符不等同的文檔標(biāo)識符,其中所述之前選擇的有序?qū)Πǚ胖糜诘谝黄沃械男g(shù)語標(biāo)識符;以及
將所選擇的有序?qū)Φ男g(shù)語標(biāo)識符放置于與所述第一片段不同的第二片段中。
6.根據(jù)權(quán)利要求1所述的方法,其中,該方法還包括以下步驟:
對包括多個條目的本體親和度矩陣進(jìn)行初始化,每個條目包括一個計數(shù)值,每個條目對應(yīng)于包括第一術(shù)語和第二術(shù)語的術(shù)語對的親和度;以及
針對所述術(shù)語標(biāo)識符索引中包括所選擇的術(shù)語對的術(shù)語標(biāo)識符的每個片段,將與所選擇的術(shù)語對的親和度相對應(yīng)的條目的計數(shù)值遞增。
7.根據(jù)權(quán)利要求1所述的方法,該方法還包括以下步驟:
生成包括多個條目的本體親和度矩陣,每個條目對應(yīng)于包括第一術(shù)語和第二術(shù)語的一個術(shù)語對的親和度,每個條目包括指示了所述術(shù)語對在所述文檔集合的一個文檔中一起出現(xiàn)的次數(shù)的計數(shù)值;以及
將所述本體親和度矩陣的每個計數(shù)值除以由如下成員構(gòu)成的組中的一個:出現(xiàn)所述第一術(shù)語的文檔的數(shù)量,出現(xiàn)所述第二術(shù)語的文檔的數(shù)量,以及出現(xiàn)所述第一術(shù)語的文檔的數(shù)量加上出現(xiàn)所述第二術(shù)語的文檔的數(shù)量。
8.根據(jù)權(quán)利要求1所述的方法,該方法還包括以下步驟:
生成包括多個條目的本體親和度矩陣,每個條目對應(yīng)于包括第一術(shù)語和第二術(shù)語的一個術(shù)語對的有向親和度,所述有向親和度包括在所述文檔集合的一個文檔中出現(xiàn)所述第一術(shù)語的情況下在所述文檔中出現(xiàn)所述第二術(shù)語的概率。
9.一種裝置,該裝置包括:
存儲器,該存儲器能操作用于進(jìn)行如下操作:
存儲包括多個反向索引列表的反向索引,每個反向索引列表對應(yīng)于一個術(shù)語,每個反向索引列表包括該術(shù)語的術(shù)語標(biāo)識符和一個或更多個文檔標(biāo)識符,所述一個或更多個文檔標(biāo)識符指示了文檔集合中的出現(xiàn)所述術(shù)語的一個或更多個文檔;以及
處理器,該操作器能操作用于執(zhí)行邏輯,以進(jìn)行如下操作:
對多個有序?qū)M(jìn)行組織,各有序?qū)Πǚ聪蛩饕斜淼男g(shù)語標(biāo)識符和文檔標(biāo)識符,所述組織操作首要地基于所述有序?qū)Φ乃鑫臋n標(biāo)識符;以及
根據(jù)所述反向索引生成術(shù)語標(biāo)識符索引,所述術(shù)語標(biāo)識符索引包括多個片段,每個片段對應(yīng)于一個文檔,每個片段包括所述文檔中出現(xiàn)的一個或更多個術(shù)語的一個或更多個術(shù)語標(biāo)識符,根據(jù)所述反向索引生成所述術(shù)語標(biāo)識符索引的操作包括以下操作:對所述術(shù)語標(biāo)識符索引的所述片段中的有序?qū)Φ男g(shù)語標(biāo)識符進(jìn)行組織。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于富士通株式會社,未經(jīng)富士通株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010117358.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:記錄裝置及記錄裝置的控制方法
- 下一篇:信息處理設(shè)備和控制方法
- 在集成電路器件中求解線性矩陣
- 矩陣計算裝置、矩陣計算方法
- 一種數(shù)據(jù)聚類的方法、裝置及Spark大數(shù)據(jù)平臺
- 適用于黑白圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 矩陣
- 矩陣/密鑰生成裝置、矩陣/密鑰生成系統(tǒng)、矩陣結(jié)合裝置、矩陣/密鑰生成方法、程序
- 矩陣運算電路、矩陣運算裝置及矩陣運算方法
- 矩陣乘法計算方法和裝置
- 數(shù)據(jù)讀取方法、裝置、介質(zhì)和計算設(shè)備





