[發(fā)明專利]一種用戶偏好檢索方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310041726.5 | 申請(qǐng)日: | 2013-02-01 |
| 公開(公告)號(hào): | CN103106268B | 公開(公告)日: | 2016-10-26 |
| 發(fā)明(設(shè)計(jì))人: | 王紅兵;王玉文;陳鑫;吳琴 | 申請(qǐng)(專利權(quán))人: | 東南大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210096*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用戶 偏好 檢索 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)領(lǐng)域,涉及用戶偏好檢索方法。
背景技術(shù)
在日趨激烈的競(jìng)爭(zhēng)環(huán)境下,用戶偏好檢索引擎能有效的將用戶轉(zhuǎn)變?yōu)橹覍?shí)的訪問者,提高Web服務(wù)能力。成功的推薦系統(tǒng)會(huì)帶來巨大的效益,不僅具有廣闊的商業(yè)前景,而且將給計(jì)算機(jī)科學(xué)諸多領(lǐng)域的發(fā)展帶來深遠(yuǎn)的影響。隨著知識(shí)經(jīng)濟(jì)的發(fā)展,Web服務(wù)偏好最終將成為一種向用戶提供個(gè)性化服務(wù)的有效手段,必將在人們的經(jīng)濟(jì)生活中有著更廣泛的應(yīng)用,扮演著更重要的角色,因此對(duì)Web服務(wù)偏好推薦技術(shù)的研究具有重要意義。
CP-net(用戶偏好模型)的性質(zhì)在學(xué)術(shù)界已經(jīng)得到廣泛研究,但針對(duì)CP-net的檢索方法還很少提出。以最具代表性的Top-k檢索為例,其實(shí)現(xiàn)的直觀方法是,通過兩兩比較排序所有的數(shù)據(jù)項(xiàng),然后選取最好的若干個(gè)(k個(gè))。這樣的方法需要至少一個(gè)順序掃描全部的數(shù)據(jù)集,這對(duì)于大數(shù)據(jù)來說代價(jià)是非常高的。另一方面,直接將兩個(gè)數(shù)據(jù)項(xiàng)按照用戶的條件偏好進(jìn)行比較,判斷哪一個(gè)更優(yōu)是一個(gè)復(fù)雜度非常高的問題。top-k檢索技術(shù)是一種支持用戶偏好的檢索引擎,能夠找到最滿足用戶需求的k個(gè)服務(wù)。
值得注意的是,本發(fā)明所涉的是用戶偏好和數(shù)據(jù)庫相結(jié)合的技術(shù)。以往的研究主要集中于如何在數(shù)據(jù)庫的查詢中表達(dá)用戶的偏好和如何基于用戶的偏好有效地檢索數(shù)據(jù)。最具代表性的以偏好為中心的數(shù)據(jù)檢索方法是Top-k和Skyline。但是,絕大部分的Top-k和Skyline方法都沒有考慮用戶偏好中各個(gè)屬性間的依賴關(guān)系。因此,很難應(yīng)用這些方法來處理由CP-net表示的用戶偏好。然而相關(guān)的數(shù)據(jù)檢索算法仍然采用定量的方法來衡量用戶對(duì)數(shù)據(jù)庫中數(shù)據(jù)項(xiàng)的感興趣程度。這些定量的方法不能準(zhǔn)確地獲得CP-net表達(dá)的定性偏好的語義。該技術(shù)主要目的是找出對(duì)CP-net數(shù)據(jù)的有效的indexing方法并根據(jù)CP-net表達(dá)的用戶偏好在數(shù)據(jù)庫中有效地檢索k個(gè)最優(yōu)的數(shù)據(jù)項(xiàng)的索引方法,使得檢索過程不必掃描整個(gè)數(shù)據(jù)庫,并構(gòu)建一個(gè)滿足不同情況的top-k檢索引擎,提供高效的檢索服務(wù)。
Hilbert(希爾伯特曲線)描述了一種多維空間與1維空間一一映射的方法,在圖像處理、多維數(shù)據(jù)索引等領(lǐng)域有著重要的地位。關(guān)于Hilbert曲線編碼生成,有兩種實(shí)現(xiàn)方法:一個(gè)是表驅(qū)動(dòng)方法,另一個(gè)是計(jì)算的方法。表驅(qū)動(dòng)方法通過掃描代碼掃描列表來實(shí)現(xiàn)曲線生成。Fish給出了一個(gè)迭代的表驅(qū)動(dòng)版本使得1維到2維的映射得以執(zhí)行。Cole給出了由2維向1維轉(zhuǎn)化的逆向的映射表驅(qū)動(dòng)版本。J?in和Melbr-Crummey提出了一個(gè)空間填充曲線產(chǎn)生的框架來有效地生成空間填充曲線。表驅(qū)動(dòng)的一個(gè)最大缺點(diǎn)就是它的空間復(fù)雜度很高。計(jì)算的方法通過一對(duì)一的計(jì)算來實(shí)現(xiàn)映射。Butz的算法計(jì)算與曲線上任意一個(gè)點(diǎn)對(duì)應(yīng)的坐標(biāo)。Faloutsos和Roseman給出了一個(gè)非迭代的方法,通過分析Z-order與Hilbert的關(guān)系來實(shí)現(xiàn)這個(gè)映射。
PCA(主值分析法)主要用于數(shù)據(jù)降維,對(duì)于一系列例子的特征組成的多維向量,多維向量里的某些元素本身沒有區(qū)分性,比如某個(gè)元素在所有的例子中都為1,或者與1差距不大,那么這個(gè)元素本身就沒有區(qū)分性,用它做特征來區(qū)分,貢獻(xiàn)會(huì)非常小。所以我們的目的是找那些變化大的元素,即方差大的那些維,而去除掉那些變化不大的維,從而使特征留下的都是“精品”,而且計(jì)算量也變小了。對(duì)于一個(gè)k維的特征來說,相當(dāng)于它的每一維特征與其他維都是正交的(相當(dāng)于在多維坐標(biāo)系中,坐標(biāo)軸都是垂直的),那么我們可以變化這些維的坐標(biāo)系,從而使這個(gè)特征在某些維上方差大,而在某些維上方差很小。我們的做法就是求得一個(gè)k維特征的投影矩陣,這個(gè)投影矩陣可以將特征從高維降到低維。投影矩陣也可以叫做變換矩陣。新的低維特征必須每個(gè)維都正交,特征向量都是正交的。通過求樣本矩陣的協(xié)方差矩陣,然后求出協(xié)方差矩陣的特征向量,這些特征向量就可以構(gòu)成這個(gè)投影矩陣了。特征向量的選擇取決于協(xié)方差矩陣的特征值的大小。
發(fā)明內(nèi)容
技術(shù)問題:本發(fā)明提供了一種可提供高效的檢索服務(wù)的用戶偏好檢索方法。
技術(shù)方案:本發(fā)明的用戶偏好檢索方法,包括以下步驟:
首先判斷多維的用戶偏好模型中,注冊(cè)中心數(shù)據(jù)的各維之間的相關(guān)性是否確定,如確定,則進(jìn)行多維降到一維的數(shù)據(jù)處理,否則進(jìn)行多維到低維的多維數(shù)據(jù)處理;
多維到一維的數(shù)據(jù)處理的步驟為:
a1)把多維的用戶偏好模型中的注冊(cè)中心數(shù)據(jù)用希爾伯特曲線降維方法降成一維注冊(cè)中心數(shù)據(jù);
a2)對(duì)所降成的一維數(shù)據(jù)建立位圖索引或B+樹索引;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學(xué),未經(jīng)東南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310041726.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 股票選股裝置及方法
- 在線文檔分享方法
- 一種移動(dòng)終端應(yīng)用偏好參數(shù)管理方法及系統(tǒng)
- 一種基于語義的中小學(xué)教育資源應(yīng)用服務(wù)系統(tǒng)
- 一種偏好設(shè)置、業(yè)務(wù)處理的系統(tǒng)、方法、裝置及設(shè)備
- 一種等值底線臨界點(diǎn)多事項(xiàng)偏好相似性度量系統(tǒng)及方法
- 包含偏好輔助決策因子優(yōu)選的交互式多準(zhǔn)則決策方法、裝置及計(jì)算機(jī)設(shè)備
- 理財(cái)產(chǎn)品的推薦方法及裝置
- 一種基于互聯(lián)網(wǎng)云大數(shù)據(jù)視頻剪輯方法及裝置
- 基于信度結(jié)構(gòu)的多不確定偏好獲取方法、裝置和電子設(shè)備
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





