[發明專利]一種基于Lucene的醫療搜索引擎服務系統建設方法在審
| 申請號: | 201610903691.5 | 申請日: | 2016-10-17 |
| 公開(公告)號: | CN107958005A | 公開(公告)日: | 2018-04-24 |
| 發明(設計)人: | 李淑范 | 申請(專利權)人: | 哈爾濱光凱科技開發有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150070 黑龍江省哈爾濱市*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 lucene 醫療 搜索引擎 服務 系統 建設 方法 | ||
1.一種基于Lucene的醫療搜索引擎服務系統建設方法,其特征在于,所述方法包括以下步驟:
第一步,分析介紹Lucene開發搜索引擎的相關技術和hadoop分布式文件系統的原理;基于hadoop的map-reduce編程模型,設計出分布式網絡爬蟲程序,實現對網絡信息的分布式抓取與檢索;
第二步,將開源中文分詞器加入系統中,在網頁和信息分析時實現中文分詞功能,對文章中的語句進行正確有效的切分,達到預定的中文分詞效果;同時加入專門的醫療詞庫,實現對專業詞匯的分析和切分;
第三步,構建搜索引擎信息檢索服務器,使用戶通過服務器提供的服務查詢想要的信息;將heartbeat組件和DRBD技術進行結合,構建高容錯性的分布式集群環境;
第四步,在搜索結果排序功能模塊中,設計新的網頁評分機制,在pagerank算法的基礎上結合主題相關性判斷,同時增加專業詞匯的權重,提高搜索結果的準確性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱光凱科技開發有限公司,未經哈爾濱光凱科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610903691.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種知識庫的構建方法和裝置
- 下一篇:可聽條形碼系統和方法





