[發(fā)明專利]農(nóng)用土地流轉(zhuǎn)信息檢索方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201410503602.9 | 申請日: | 2014-09-26 |
| 公開(公告)號: | CN104536957B | 公開(公告)日: | 2017-11-24 |
| 發(fā)明(設計)人: | 宮阿都;李玉潔;陳云浩;岳建偉;崔言輝;蘇永榮;李冰 | 申請(專利權(quán))人: | 北京師范大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京京萬通知識產(chǎn)權(quán)代理有限公司11440 | 代理人: | 許天易,馬云超 |
| 地址: | 100875 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 農(nóng)用 土地 流轉(zhuǎn) 信息 檢索 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種農(nóng)業(yè)用土地流轉(zhuǎn)信息的檢索方法,本發(fā)明還涉及一種農(nóng)業(yè)用土地信息檢索系統(tǒng)。
背景技術(shù)
目前主流的搜索引擎檢索算法是基于關(guān)鍵詞匹配的檢索算法,常用的排序算法包括詞頻位置加權(quán)排序算法、Direct Hit算法、PageRank算法等。
基于關(guān)鍵詞匹配的檢索算法中,可以將所有只要包含查詢語句中涉及詞語中的一個或多個的信息全部檢索出來,這種詞形匹配方式容易造成檢索結(jié)果冗余。而且在進行土地流轉(zhuǎn)信息檢索時,沒有考慮該類信息的地理位置相關(guān)性的重要特點,往往得不到理想的結(jié)果。
目前,盡管圖像、視頻等內(nèi)容的檢索技術(shù)也有了很好的發(fā)展,但是網(wǎng)絡上絕大多數(shù)的信息為文本信息,因此文本信息檢索在信息檢索領(lǐng)域仍然占據(jù)著主要地位。文本信息檢索是傳統(tǒng)(文獻)檢索方式的延續(xù),是指從大量的文本資源集合中自動地找到與用戶查詢條件相關(guān)的各種信息。傳統(tǒng)的文本信息檢索采用的技術(shù)模型主要有布爾模型、向量空間模型和概率模型,使用較多的是向量空間模型。
傳統(tǒng)的基于關(guān)鍵詞檢索的文本信息檢索方法存在許多問題:
(1)基于關(guān)鍵詞檢索方法中較常使用的檢索模型是是向量空間模型,此模型可以將任意文檔表示成詞條向量。當文本數(shù)量較多時,該詞項-文檔矩陣將成為高階稀疏矩陣,空間維數(shù)較高,內(nèi)存占用空間較大,信息處理速度較慢。
(2)基于關(guān)鍵詞檢索方法僅僅考慮字形匹配,沒有考慮文本信息中詞語之間的語義關(guān)系,不能處理同義詞、近義詞的問題,準確率并不理想。
(3)農(nóng)用土地流轉(zhuǎn)信息中包括很多地理信息,當用戶檢索一塊區(qū)域的流轉(zhuǎn)信息時,基于關(guān)鍵字匹配的檢索方法沒有辦法考慮地理位置的空間信息,將包含在該區(qū)域內(nèi)的地塊信息全部檢索出來。
此外,在針對檢索結(jié)果進行排序的算法中,詞頻位置加權(quán)排序算法是基于網(wǎng)頁信息內(nèi)容分析的排序算法,其中詞語與網(wǎng)頁內(nèi)容的相似度則由它出現(xiàn)的頻次和位置決定。DirectHit是一種注重信息質(zhì)量和用戶行為反饋的排序算法,網(wǎng)頁被點擊的次數(shù)和瀏覽的時間長度都影響網(wǎng)頁與用戶查詢語句的相似度。PageRank算法是一種鏈接分析算法。在該算法中,網(wǎng)頁的重要性由兩部分決定:(1)該頁面被多少頁面引用;(2)該頁面被什么頁面引用。針對土地流轉(zhuǎn)信息的特點,應該充分考慮空間關(guān)系對地理要素的語義相似度的影響,并將這一部分作為影響文檔與查詢語句相似度的一個重要因素。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中的不足,本發(fā)明旨在提供一種基于地名匹配的農(nóng)用土地流轉(zhuǎn)信息檢索方法,以解決傳統(tǒng)算法對于土地流轉(zhuǎn)供求信息檢索效果不佳的問題。
進一步地,在此基礎(chǔ)上,本發(fā)明還提供了一種基于地理要素的土地流轉(zhuǎn)信息排序方法,以解決傳統(tǒng)算法對于檢索出的土地流轉(zhuǎn)供求信息排序效果不佳的問題。
為了解決上述問題,該種農(nóng)用土地流轉(zhuǎn)信息檢索方法,其包括如下步驟:
服務器接收用戶輸入的檢索條件;
服務器對檢索條件和待檢索的農(nóng)用土地流轉(zhuǎn)信息進行分詞處理,得到分詞化檢索條件和分詞化農(nóng)用土地流轉(zhuǎn)信息;
服務器查找分詞化檢索條件中的包含的地名信息,并根據(jù)地名匹配算法找到各地名信息所包含的下級地名信息;
服務器根據(jù)該地名信息以及下級地名信息對所述分詞化農(nóng)用土地流轉(zhuǎn)信息進行篩選,得到篩選后的分詞化農(nóng)用土地流轉(zhuǎn)信息;
服務器根據(jù)分詞化檢索條件和篩選后的分詞化農(nóng)用土地流轉(zhuǎn)信息創(chuàng)建向量空間模型,得到詞匯-文檔矩陣;
服務器計算該詞匯-文檔矩陣中的分詞化檢索條件與篩選后的分詞化農(nóng)用土地流轉(zhuǎn)信息之間的相似度sim1;
服務器將相似度sim1滿足一定閾值的農(nóng)用土地流轉(zhuǎn)信息發(fā)送給用戶。
優(yōu)選地,還包括步驟:
所述服務器得到詞匯-文檔矩陣后,對該詞匯-文檔矩陣進行潛語義分析操作,得到去噪后的詞匯-文檔矩陣,服務器根據(jù)該去噪后的詞匯-文檔矩陣計算分詞化檢索條件與篩選后的分詞化農(nóng)用土地流轉(zhuǎn)信息之間的相似度sim1。
更優(yōu)選地,所述對詞匯-文檔矩陣進行潛語義分析操作包括如下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京師范大學,未經(jīng)北京師范大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410503602.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





