[發明專利]基于富文本的高亮方法及裝置在審
| 申請號: | 202011266905.5 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112380337A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 戎緒虎 | 申請(專利權)人: | 平安普惠企業管理有限公司 |
| 主分類號: | G06F16/338 | 分類號: | G06F16/338;G06F16/332 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 文本 方法 裝置 | ||
本申請實施例提供了一種基于富文本的高亮方法及裝置,該方法包括:獲取第一搜索結果,所述第一搜索結果為基于第一關鍵信息搜索得到的搜索結果;從所述第一搜索結果中查找第二搜索結果,所述第二搜索結果為包括富文本的搜索結果;對所述第二搜索結果進行解析,得到第一內容;基于所述第一關鍵信息對所述第一內容進行高亮。本申請通過對搜索結果進行解析,得到富文本數據的文本內容,并對富文本數據的文本內容中的關鍵信息進行高亮,可以保證搜索結果中html標簽的完整性,從而實現基于富文本的高亮顯示,提高了搜索的精確度。
技術領域
本申請涉及計算機技術領域,尤其涉及一種基于富文本的高亮方法及裝置。
背景技術
目前,關鍵詞搜索已經被廣泛應用在不同的業務系統中,在基于純文本的搜索時,會對關鍵字前后添加指定的高亮標簽進行高亮顯示,但是如果關鍵詞為英文并且原始文檔數據是含有富文本標簽時,在通過英文關鍵字進行搜索時,往往達不到想要的高亮效果,比如一份原始的富文本文檔存儲時帶有一些html標簽,例如文本:spanPing an/span,當搜索的關鍵字為英文“an”時,由于span標簽中也含有an英文單詞,因此在an前后添加高亮標簽時會破壞原有span標簽的完整性,導致搜索出來的結果出現sp的出現,原始文本的富文本效果顯示不出來,導致頁面展示的搜索結果不正確,搜索的結果出現格式錯誤。
發明內容
本申請實施例提供了一種基于富文本的高亮方法及裝置,能夠保證html標簽的完整性,實現基于富文本的高亮,提高搜索的精確度。
第一方面,本申請實施例提供一種基于富文本的高亮方法,所述方法包括:
獲取第一搜索結果,所述第一搜索結果為基于第一關鍵信息搜索得到的搜索結果;
從所述第一搜索結果中查找第二搜索結果,所述第二搜索結果為包括富文本的搜索結果;
對所述第二搜索結果進行解析,得到第一內容;
基于所述第一關鍵信息對所述第一內容進行高亮。
可選的,所述對所述第二搜索結果進行解析,得到第一內容,包括:
遍歷所述第二搜索結果,將所述第二搜索結果中的html標簽轉換為Jsoup可識別的Document對象;
基于Elements對象操作,從所述Document對象中獲取第一內容,所述第一內容為所述第二搜索結果中所述html標簽的文本內容。
可選的,所述基于所述第一關鍵信息對所述第一內容進行高亮,包括:
將所述第一內容與所述第一關鍵信息進行匹配,得到第二關鍵信息,所述第一關鍵信息包括所述第二關鍵信息;
對所述第二關鍵信息進行高亮。
可選的,所述對所述第二關鍵信息進行高亮,包括:
獲取第二關鍵信息在所述第一內容中的起始位置和結束位置;
基于所述起始位置和所述結束位置,分別將所述第一內容切割成至少一個子文本內容;
對第一子文本內容添加高亮標簽,所述第一子文本內容為包括所述第二關鍵信息的任一子文本內容;
基于所述至少一個子文本內容的排列順序,重新組裝所述至少一個子文本內容。
可選的,所述第一搜索結果包括至少一個字符串數組;
所述獲取第一搜索結果,包括:
將所述第一關鍵信息進行劃分成至少一個關鍵子信息;
查詢與第一關鍵子信息匹配的第二內容,所述第一關鍵子信息為所述至少一個關鍵子信息中的任一關鍵子信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安普惠企業管理有限公司,未經平安普惠企業管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011266905.5/2.html,轉載請聲明來源鉆瓜專利網。





