[發(fā)明專利]基于標(biāo)引關(guān)聯(lián)關(guān)系的信息檢索排序方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201110083624.0 | 申請(qǐng)日: | 2011-04-02 |
| 公開(公告)號(hào): | CN102163222A | 公開(公告)日: | 2011-08-24 |
| 發(fā)明(設(shè)計(jì))人: | 池慧;高東平;方安;洪娜 | 申請(qǐng)(專利權(quán))人: | 中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100020*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 標(biāo)引 關(guān)聯(lián) 關(guān)系 信息 檢索 排序 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種對(duì)檢索結(jié)果的排序方法,屬于信息分析與輔助決策領(lǐng)域。
背景技術(shù)
在檢索文獻(xiàn)時(shí)為了獲得更加精準(zhǔn)的檢索結(jié)果,尤其是在某學(xué)科或領(lǐng)域進(jìn)行文獻(xiàn)檢索時(shí),經(jīng)常會(huì)出現(xiàn)由于檢索詞使用不當(dāng),或用戶主觀描述偏差而產(chǎn)生的檢索結(jié)果不精準(zhǔn)。實(shí)際上,檢索詞之間也具有關(guān)聯(lián)關(guān)系,如上下位或同位關(guān)系等,根據(jù)檢索詞之間的關(guān)聯(lián)關(guān)系,可判斷用戶提出的檢索詞集合與待查文獻(xiàn)具有的標(biāo)引集合之間的相似度,用來(lái)獲得該文獻(xiàn)是否為用戶所需,或與用戶意圖是否相關(guān),從而對(duì)檢索結(jié)果進(jìn)行排序,以提高檢索準(zhǔn)確度。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于標(biāo)引關(guān)聯(lián)關(guān)系的信息檢索排序方法,以快速準(zhǔn)確的解決公眾(針對(duì)專業(yè)知識(shí)匱乏的人群或者語(yǔ)言習(xí)慣和表述多樣化)由于錯(cuò)誤或不確切的描述檢索詞而造成的檢索結(jié)果有誤差。通過標(biāo)引到文獻(xiàn)的關(guān)聯(lián)映射,實(shí)現(xiàn)檢索結(jié)果的排序,向用戶提供相關(guān)度最大的一系列檢索結(jié)果。尤其適用于在專業(yè)范圍對(duì)相近或相似文獻(xiàn)進(jìn)行檢索相關(guān)度排序。
本發(fā)明所述一種基于標(biāo)引關(guān)聯(lián)關(guān)系的信息檢索排序方法,包括如下步驟:
步驟1:根據(jù)檢索詞的規(guī)范名稱補(bǔ)充與這些基本檢索詞具有上下位、同位等關(guān)聯(lián)關(guān)系的詞匯,將基本檢索詞和補(bǔ)充的詞匯作為標(biāo)引庫(kù)的構(gòu)成元素,并建立和保存標(biāo)引庫(kù)中每?jī)蓚€(gè)標(biāo)引之間的關(guān)聯(lián)關(guān)系;所述每?jī)蓚€(gè)標(biāo)引之間的關(guān)聯(lián)關(guān)系包括上下位、同位關(guān)聯(lián)關(guān)系;其中所述上下位關(guān)系包括標(biāo)引之間的從屬關(guān)系,所述同位關(guān)系包括同義、近義、相似關(guān)系。
步驟2:將每篇文獻(xiàn)相關(guān)的檢索詞作為該文獻(xiàn)的標(biāo)引,以每篇文獻(xiàn)所具有的標(biāo)引的集合構(gòu)成該文獻(xiàn)的文獻(xiàn)模型α=(a1,a2,…,ak,…,am),其中m為該文獻(xiàn)具有的標(biāo)引的個(gè)數(shù);將各文獻(xiàn)模型作為文獻(xiàn)庫(kù)的構(gòu)成元素;
步驟3:把每個(gè)文獻(xiàn)模型構(gòu)建為一個(gè)文獻(xiàn)向量,構(gòu)建方法為:
以該文獻(xiàn)模型包含的所有標(biāo)引的權(quán)值構(gòu)成文獻(xiàn)向量其中是該文獻(xiàn)模型中標(biāo)引ak的權(quán)值,其取值表示標(biāo)引ak與該文獻(xiàn)A之間的關(guān)聯(lián)程度,權(quán)值越大則關(guān)聯(lián)程度越高;作為優(yōu)選,所述文獻(xiàn)模型中標(biāo)引ak的權(quán)值是根據(jù)該標(biāo)引ak在該文獻(xiàn)中出現(xiàn)頻率和/或出現(xiàn)位置預(yù)先設(shè)置的。
步驟4:在進(jìn)行檢索之前,將用戶提供的所有檢索詞即標(biāo)引的集合構(gòu)成一個(gè)檢索模型B;即檢索模型B為β=(b1,b2,…,bj,…,bn),共包含n個(gè)標(biāo)引;
步驟5:將當(dāng)前檢索模型B構(gòu)建為一個(gè)檢索向量;構(gòu)建方法為:
以當(dāng)前檢索模型B中包含的所有標(biāo)引的權(quán)值構(gòu)成檢索向量其中表示檢索模型B中的標(biāo)引bj的權(quán)值,對(duì)其賦值采用如下兩種方法之一:
(1)根據(jù)用戶輸入該標(biāo)引的順序或用戶主觀認(rèn)為其與檢索結(jié)果的主要程度進(jìn)行賦值,標(biāo)引越主要或輸入順序越靠前則權(quán)值越大;
(2)檢索模型B中的各標(biāo)引均采取相同的權(quán)值,即不區(qū)分標(biāo)引順序和主要程度;
步驟6:計(jì)算當(dāng)前檢索模型B與各文獻(xiàn)的文獻(xiàn)模型之間的相似度,相似度越大則認(rèn)為該文獻(xiàn)與用戶需要的檢索結(jié)果之間相關(guān)程度越大,文獻(xiàn)模型A和檢索模型B的相似度Sim(A,B)采用如下公式來(lái)計(jì)算:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所,未經(jīng)中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110083624.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種在報(bào)紙版面上檢查標(biāo)引稿件的方法及系統(tǒng)
- 一種報(bào)刊版面網(wǎng)絡(luò)標(biāo)引的方法及系統(tǒng)
- 標(biāo)引嵌入方法及設(shè)備、標(biāo)引檢測(cè)方法、設(shè)備、及系統(tǒng)
- 圖片標(biāo)引的方法和裝置
- 一種音視頻數(shù)據(jù)標(biāo)引的方法和系統(tǒng)
- 一種網(wǎng)絡(luò)貼文標(biāo)引系統(tǒng)及標(biāo)引方法
- 圖片標(biāo)引方法和圖片標(biāo)引裝置
- 導(dǎo)盲的方法和裝置以及導(dǎo)盲設(shè)備
- 一種基于Triz的專利標(biāo)引系統(tǒng)及其方法
- Word論文的標(biāo)引方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 關(guān)聯(lián)裝置
- 數(shù)據(jù)關(guān)聯(lián)裝置和數(shù)據(jù)關(guān)聯(lián)方法
- 安全關(guān)聯(lián)
- 設(shè)備關(guān)聯(lián)
- 終端關(guān)聯(lián)裝置和終端關(guān)聯(lián)方法
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)分析方法和關(guān)聯(lián)分析系統(tǒng)
- 報(bào)文關(guān)聯(lián)方法、報(bào)文關(guān)聯(lián)裝置及報(bào)文關(guān)聯(lián)系統(tǒng)
- 關(guān)系視圖
- 位置關(guān)系檢測(cè)裝置以及位置關(guān)系檢測(cè)系統(tǒng)
- 關(guān)系建模
- 關(guān)系分析方法、關(guān)系分析程序、以及關(guān)系分析裝置
- 實(shí)體關(guān)系分類裝置和實(shí)體關(guān)系分類方法
- 用戶關(guān)系抽取方法和用戶關(guān)系抽取系統(tǒng)
- 融合依存關(guān)系與篇章修辭關(guān)系的事件時(shí)序關(guān)系識(shí)別方法
- 開關(guān)系統(tǒng)
- 視頻視覺關(guān)系檢測(cè)的關(guān)系片段連接方法
- 開關(guān)系統(tǒng)





