[發(fā)明專利]一種獨(dú)立搜索的ApacheLucene評分高亮方法有效
| 申請?zhí)枺?/td> | 201710117547.3 | 申請日: | 2017-03-01 |
| 公開(公告)號: | CN106933999B | 公開(公告)日: | 2020-05-08 |
| 發(fā)明(設(shè)計(jì))人: | 何小成;黃三偉 | 申請(專利權(quán))人: | 湖南蟻坊軟件股份有限公司 |
| 主分類號: | G06F16/338 | 分類號: | G06F16/338;G06F16/33 |
| 代理公司: | 山東博睿律師事務(wù)所 37238 | 代理人: | 丁波 |
| 地址: | 410000 湖南省長沙市高新開發(fā)*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 獨(dú)立 搜索 apachelucene 評分 方法 | ||
1.一種獨(dú)立搜索的ApacheLucene評分高亮方法;其特征在于:該方法包括如下步驟:
步驟1:數(shù)據(jù)接收,高亮服務(wù)接收客戶端通過http協(xié)議傳輸過來的搜索語句參數(shù);所述的數(shù)據(jù)接收之前需要先單獨(dú)部署一套Apache Solr集群,不存儲數(shù)據(jù),專門用來做高亮;
步驟2:數(shù)據(jù)轉(zhuǎn)化,將步驟1接收搜索語句參數(shù)轉(zhuǎn)成ApacheLucene的Query對象;所述的數(shù)據(jù)轉(zhuǎn)化,編寫HighlightHandler類,繼承ApacheSolr的RequestHandlerBase抽象類以及實(shí)現(xiàn)SolrCoreAware、PluginInfoInitialized接口;然后重寫handleRequestBody方法,接著調(diào)用QParser的getParser方法得到QParser將搜索語句轉(zhuǎn)成ApacheLucene的Query對象;
步驟3:數(shù)據(jù)預(yù)處理,初始化ApacheLucene的評分器QueryScorer以及初始化高亮器Highlighter;通過評分器QueryScorer對Query對象進(jìn)行評分和分詞,得到Query的詞組,對需要做高亮的文本進(jìn)行分詞器分詞,得到文本詞;
步驟4:數(shù)據(jù)處理,遍歷文本分詞后的結(jié)果,與通過評分器QueryScorer評分后的Query分詞結(jié)果進(jìn)行一一匹配;
步驟5:數(shù)據(jù)輸出,通過步驟4的匹配,如果能匹配上,則加上高亮標(biāo)記,否則返回原始內(nèi)容。
2.根據(jù)權(quán)利要求1所述的一種獨(dú)立搜索的ApacheLucene評分高亮方法;其特征在于:所述的數(shù)據(jù)預(yù)處理,通過構(gòu)造函數(shù)新建QueryScorer,輸入Query參數(shù),通過構(gòu)造函數(shù)新建Highlighter,輸入QueryScorer。
3.根據(jù)權(quán)利要求1所述的一種獨(dú)立搜索的ApacheLucene評分高亮方法;其特征在于:所述的數(shù)據(jù)輸出,調(diào)用Highlighter的getBestFragment方法輸入分詞器以及需要高亮的文本,得到高亮后的文本。
4.根據(jù)權(quán)利要求1所述的一種獨(dú)立搜索的ApacheLucene評分高亮方法;其特征在于:所述的數(shù)據(jù)預(yù)處理、數(shù)據(jù)處理ApacheLucene評分器的評分機(jī)制獨(dú)立運(yùn)行,搜索的高亮方法可獨(dú)立安插插件,插件為在solrconfig.xml中配置requestHandler。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖南蟻坊軟件股份有限公司,未經(jīng)湖南蟻坊軟件股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710117547.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





