[發(fā)明專利]一種基于特征分析的數(shù)據(jù)索引方法無效
| 申請?zhí)枺?/td> | 201210408561.6 | 申請日: | 2012-10-24 |
| 公開(公告)號: | CN103778152A | 公開(公告)日: | 2014-05-07 |
| 發(fā)明(設(shè)計(jì))人: | 姚進(jìn)德;艾順剛;張思謙 | 申請(專利權(quán))人: | 鎮(zhèn)江睿泰信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 212005 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 特征 分析 數(shù)據(jù) 索引 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種數(shù)據(jù)索引的方法,具體的涉及基于特征分析的數(shù)據(jù)索引方法,屬于計(jì)算機(jī)技術(shù)應(yīng)用領(lǐng)域。
背景技術(shù)
隨著互聯(lián)網(wǎng)規(guī)模的不斷增大,網(wǎng)上信息量也急劇膨脹,信息的檢索也從最初的圖書館和科技信息機(jī)構(gòu),擴(kuò)大到其他各行領(lǐng)域,并與各種管理信息系統(tǒng)結(jié)合在一起。
目前比較常用的兩種方式是“推”技術(shù)(Push?Technology)和“拉”技術(shù)(Pull?Technology),前者主要采用類似郵件的方式將相關(guān)信息數(shù)據(jù)顯式傳遞給使用者,后者一般通過檢索工具(如全文檢索、知識地圖、決策樹等)查找知識庫來獲取所要的數(shù)據(jù)。
但上述的兩種方式,在海量的數(shù)據(jù)面前,都暴露出諸多問題。一是檢索效率不高,每次查詢都要多次訪問數(shù)據(jù)庫或是其他外存,當(dāng)瞬間請求量超額時,響應(yīng)速度降低,容易造成系統(tǒng)不穩(wěn)定;二是檢索準(zhǔn)確度不高,每次的檢索詞信息量有限,因此在計(jì)算詞與文檔相關(guān)性的時候,往往不夠準(zhǔn)確。
發(fā)明內(nèi)容
發(fā)明目的:本發(fā)明的目的在于針對上述現(xiàn)有技術(shù)中存在的問題和不足提供一種基于特征分析的數(shù)據(jù)索引方法,以提高檢索效率和準(zhǔn)確度。
技術(shù)方案:一種基于特征分析的數(shù)據(jù)索引方法,包括如下步驟:
(1)對用戶數(shù)據(jù)信息進(jìn)行判斷,確定其所感興趣的數(shù)據(jù)特征;
(2)統(tǒng)計(jì)步驟(1)中各特征的訪問概率和訪問間隔時間;
(3)根據(jù)概率高優(yōu)先和間隔時間短優(yōu)先的策略,建立特征索引表;
(4)進(jìn)行基于特征索引表的綜合檢索,返回結(jié)果。
用戶的數(shù)據(jù)特征包括專業(yè)技術(shù)類別、應(yīng)用領(lǐng)域、使用地域、解決問題、基礎(chǔ)知識原理、關(guān)鍵字、關(guān)聯(lián)項(xiàng)目、關(guān)聯(lián)客戶等。
對用戶特征數(shù)據(jù)的統(tǒng)計(jì),采取90天重新統(tǒng)計(jì)一次的定期統(tǒng)計(jì)方式,確保有效性和穩(wěn)定性。
特征索引表隨著統(tǒng)計(jì)數(shù)據(jù)定期更新,避免數(shù)據(jù)脫離實(shí)際需求,同時也不會過于頻繁變化而造成不穩(wěn)定性。
有益效果:本發(fā)明提供的基于特征分析的數(shù)據(jù)索引方法,針對用戶的個性需求,通過日常不斷分析用戶的行為和記錄,得出其所感興趣的數(shù)據(jù)特征,從而建立有效的特征索引表,提高數(shù)據(jù)搜索的針對性和有效性,顯著提高特征數(shù)據(jù)的查詢效率。
附圖說明
圖1為本發(fā)明實(shí)施例的工作流程圖。
具體實(shí)施方式
下面結(jié)合附圖和具體實(shí)施例,進(jìn)一步闡明本發(fā)明,應(yīng)理解這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍,在閱讀了本發(fā)明之后,本領(lǐng)域技術(shù)人員對本發(fā)明的各種等價形式的修改均落于本申請所附權(quán)利要求所限定的范圍。
如圖1所示,一種基于特征分析的數(shù)據(jù)索引方法,包括如下步驟:
(1)對用戶數(shù)據(jù)信息進(jìn)行判斷,確定其所感興趣的數(shù)據(jù)特征;
(2)統(tǒng)計(jì)步驟(1)中各特征的訪問概率和訪問間隔時間;
(3)根據(jù)概率高優(yōu)先和間隔時間短優(yōu)先的策略,建立特征索引表;
(4)進(jìn)行基于特征索引表的綜合檢索,返回結(jié)果。
用戶的數(shù)據(jù)特征包括專業(yè)技術(shù)類別、應(yīng)用領(lǐng)域、使用地域、解決問題、基礎(chǔ)知識原理、關(guān)鍵字、關(guān)聯(lián)項(xiàng)目、關(guān)聯(lián)客戶等。
對用戶特征數(shù)據(jù)的統(tǒng)計(jì),采取90天重新統(tǒng)計(jì)一次的定期統(tǒng)計(jì)方式,確保有效性和穩(wěn)定性。
特征索引表隨著統(tǒng)計(jì)數(shù)據(jù)定期更新,避免數(shù)據(jù)脫離實(shí)際需求,同時也不會過于頻繁變化而造成不穩(wěn)定性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鎮(zhèn)江睿泰信息科技有限公司,未經(jīng)鎮(zhèn)江睿泰信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210408561.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:同心式流量調(diào)節(jié)器
- 下一篇:交換機(jī)芯片堆疊方法
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





