[發(fā)明專利]一種基于用戶興趣模型的個(gè)性化摘要系統(tǒng)無效
| 申請?zhí)枺?/td> | 200810224285.1 | 申請日: | 2008-10-16 |
| 公開(公告)號(hào): | CN101373486A | 公開(公告)日: | 2009-02-25 |
| 發(fā)明(設(shè)計(jì))人: | 劉永利;歐陽元新;袁滿;熊璋 | 申請(專利權(quán))人: | 北京航空航天大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京永創(chuàng)新實(shí)專利事務(wù)所 | 代理人: | 趙文利 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶 興趣 模型 個(gè)性化 摘要 系統(tǒng) | ||
1.一種基于用戶興趣模型的個(gè)性化摘要系統(tǒng),該個(gè)性化摘要系統(tǒng)由Web信息檢索單元、用戶興趣單元和個(gè)性化摘要單元組成;其特征在于:
所述Web信息檢索單元根據(jù)查詢請求負(fù)責(zé)完成對(duì)Web頁面的索引和檢索任務(wù),并將檢索結(jié)果WR輸出給個(gè)性化摘要單元、將檢索日志W(wǎng)LOG輸出給用戶興趣單元;
所述用戶興趣單元根據(jù)Web信息檢索單元提供的檢索日志W(wǎng)LOG,利用概念聚類法建立以層次概念結(jié)構(gòu)描述的用戶興趣模型IC,所述用戶興趣模型IC為用戶在通過Web信息檢索單元進(jìn)行檢索時(shí),所訪問的Web頁面對(duì)象的并集;表達(dá)形式為IC={p1,p2,p3,......,pM},其中,p表示W(wǎng)eb頁面對(duì)象,M表示W(wǎng)eb頁面的數(shù)量;
所述個(gè)性化摘要單元(A)根據(jù)用戶興趣單元提供的用戶興趣模型IC與Web信息檢索單元輸出的檢索結(jié)果WR進(jìn)行用戶興趣與檢索結(jié)果中句子相似度的解析,獲得相似度I(s),I(s)=max(I(c1,s),I(c2,s),……,I(cn,s))輸出給個(gè)性化句子評(píng)分處理;
I(s)=max(I(c1,s),I(c2,s),……,I(cn,s))中,c表示概念,s表示一個(gè)句子,n表示用戶興趣的概念個(gè)數(shù);
(B)利用檢索結(jié)果WR計(jì)算出句子中的查詢關(guān)鍵詞的逆文本頻率IDF,然后依據(jù)逆文本頻率IDF計(jì)算每一個(gè)句子s的分值Sidf(s),并將分值Sidf(s)輸出給個(gè)性化句子評(píng)分處理;
(C)利用檢索結(jié)果WR計(jì)算出每一個(gè)句子s中的信息量Sic(s),并將信息量Sic(s)輸出給個(gè)性化句子評(píng)分處理;
(D)個(gè)性化句子評(píng)分處理依據(jù)最終評(píng)分對(duì)每一個(gè)句子s進(jìn)行重要性排序,并將排序結(jié)果中前K項(xiàng)組成一個(gè)個(gè)性化摘要輸出給用戶,從而完成在用戶模型下的個(gè)性化摘要的訂制;
其中,最終評(píng)分中的α表示分值Sidf(s)的系數(shù),β表示信息量Sic(s)的系數(shù),γ表示相似度I(s)的系數(shù)。
2.根據(jù)權(quán)利要求1所述的基于用戶興趣模型的個(gè)性化摘要系統(tǒng),其特征在于:用戶興趣模型中的每個(gè)概念c用一組關(guān)鍵詞及其權(quán)重的二元組表示為c={(t1,W1),(t2,W2)……,(tm,Wm)},t表示關(guān)鍵詞,W表示關(guān)鍵詞的權(quán)重,m表示概念c所包含的關(guān)鍵詞個(gè)數(shù)。
3.根據(jù)權(quán)利要求1所述的基于用戶興趣模型的個(gè)性化摘要系統(tǒng),其特征在于:在個(gè)性化摘要單元中,所述分值中IDFt表示出現(xiàn)在句子s中的查詢關(guān)鍵詞t的倒排詞頻,tq表示查詢q中的關(guān)鍵詞組成的集合,Sidf(s)反映了句子包含查詢關(guān)鍵詞的多少。
4.根據(jù)權(quán)利要求1所述的基于用戶興趣模型的個(gè)性化摘要系統(tǒng),其特征在于:在個(gè)性化摘要單元中,所述信息量中Weightt表示TF*IDF算法計(jì)算
得到的關(guān)鍵詞t的權(quán)重,ts表示句子s中的關(guān)鍵詞組成的集合,f表示一個(gè)句子長度調(diào)節(jié)系數(shù);Sic(s)反映了句子所包含信息的多少,在生成摘要的過程中作為Sidf(s)的輔助因素。
5.根據(jù)權(quán)利要求1所述的基于用戶興趣模型的個(gè)性化摘要系統(tǒng),其特征在于:排序結(jié)果中前K項(xiàng)中K的取值為排序結(jié)果中的前2~5句句子。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學(xué),未經(jīng)北京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810224285.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:測量水溫的溫度傳感器
- 下一篇:一種小推車止動(dòng)裝置
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 興趣點(diǎn)系統(tǒng)、興趣點(diǎn)信息系統(tǒng)以及下載多個(gè)興趣點(diǎn)的方法
- 用戶興趣點(diǎn)的確定方法、裝置及終端
- 一種全局興趣探索推薦方法和裝置
- 信息中心聯(lián)網(wǎng)中的跟蹤排隊(duì)延遲和執(zhí)行相關(guān)的擁塞控制的方法、裝置及介質(zhì)
- 興趣點(diǎn)重要度測量方法和裝置
- 一種導(dǎo)航方法及系統(tǒng)
- 興趣偏好預(yù)測方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種興趣點(diǎn)的質(zhì)量評(píng)分獲取方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 聚合興趣點(diǎn)的方法、裝置、設(shè)備和介質(zhì)
- 用于優(yōu)化興趣點(diǎn)標(biāo)簽的方法和裝置





