[發明專利]一種基于自然語言分析的排序方法和系統以及設備在審
| 申請號: | 201910331228.1 | 申請日: | 2019-04-23 |
| 公開(公告)號: | CN110059253A | 公開(公告)日: | 2019-07-26 |
| 發明(設計)人: | 羅筱筱 | 申請(專利權)人: | 重慶慧安鏈科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/33;G06F16/31;G06F16/335 |
| 代理公司: | 重慶樂泰知識產權代理事務所(普通合伙) 50221 | 代理人: | 婁淑賢 |
| 地址: | 400023 重慶市江*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征數據 索引 自然語言分析 模糊 排序 抽取 輸入信息 數據信息 關聯度 創建 搜索結果排序 歸一化處理 索引數據庫 搜索結果 搜索匹配 搜索引擎 詞抽取 搜索框 匹配 展示 搜索 | ||
本發明公開了一種基于自然語言分析的排序方法和系統以及設備。其中,所述方法包括:獲取輸入到搜索引擎中搜索框里的輸入信息,和采用自然語言分析方式,對該獲取的輸入信息進行關鍵詞和/或模糊詞抽取,和對該抽取的關鍵詞和/或模糊詞進行歸一化處理,以使該抽取的關鍵詞和/或模糊詞的各個特征對應的數據取值范圍一致,形成該抽取的關鍵詞和/或模糊詞的特征數據,和對該形成的特征數據創建特征數據索引,以及根據該創建的特征數據索引,在索引數據庫中搜索匹配該創建的特征數據索引的數據信息,并將該搜索出的匹配該創建的特征數據索引的數據信息的搜索結果按關聯度排序展示。通過上述方式,能夠實現提高搜索結果排序展示關聯度。
技術領域
本發明涉及搜索技術領域,尤其涉及一種基于自然語言分析的排序方法和系統以及設備。
背景技術
所謂關鍵詞就是人們使用引擎找信息的時候輸入到搜索框里的文字。比如“歡樂谷”就是關鍵詞,另外“深圳歡樂谷”、“歡樂谷官網”等等都是關鍵詞,這類關鍵詞可以叫做復合關鍵詞。
所謂關鍵詞匹配度是指關鍵詞和頁面內容中所含關鍵詞的相同程度,即搜索關鍵詞與文章中的標題或內容里的相符合程度,匹配程度越高,越利于關鍵詞排名。
所謂模糊匹配的定義主要有兩種觀點:
一種觀點是系統允許被搜索信息和搜索提問之間存在一定的差異,這種差異就是“模糊”在搜索中的含義。例如,查找名字Smith時,就會找出與之相似的Smithe,Smythe,Smyth,Smitt等。
另一種觀點是實質上的搜索系統自動進行的同義詞搜索。同義詞由系統的管理界面配置。例如,配置“計算機”與“computer”為同義詞后,搜索“計算機”,則包含“computer”的網頁也會出現在搜索結果中。
如今關鍵詞匹配技術和模糊匹配技術是檢索系統主要采用的方式,這種方式具有如下不足:
搜索結果排序展示關聯度不大。搜索結果排序展示僅僅通過關鍵詞進行判斷,排序關聯度不大,導致使用者無法通過展示序列快速找到需要的數據信息,其在部分需要快速精準的檢索大量數據并展示相關內容的場景中效果有限。
發明內容
有鑒于此,本發明的目的在于提出一種基于自然語言分析的排序方法和系統以及設備,能夠實現提高搜索結果排序展示關聯度。
根據本發明的一個方面,提供一種基于自然語言分析的排序方法,包括:
獲取輸入到搜索引擎中搜索框里的輸入信息;
采用自然語言分析方式,對所述獲取的輸入信息進行關鍵詞和/或模糊詞抽取;
對所述抽取的關鍵詞和/或模糊詞進行歸一化處理,以使所述抽取的關鍵詞和/或模糊詞的各個特征對應的數據取值范圍一致,形成所述抽取的關鍵詞和/或模糊詞的特征數據;
對所述形成的所述抽取的關鍵詞和/或模糊詞的特征數據創建特征數據索引;
根據所述創建的特征數據索引,在索引數據庫中搜索匹配所述創建的特征數據索引的數據信息,并將所述搜索出的匹配所述創建的特征數據索引的數據信息的搜索結果按關聯度排序展示。
其中,所述對所述抽取的關鍵詞和/或模糊詞進行歸一化處理,以使所述抽取的關鍵詞和/或模糊詞的各個特征對應的數據取值范圍一致,形成所述抽取的關鍵詞和/或模糊詞的特征數據,包括:
從所述抽取的關鍵詞和/或模糊詞中提取至少一個特征,對所述提取的至少一個特征進行歸一化處理,以使所述抽取的關鍵詞和/或模糊詞的各個特征對應的數據取值范圍一致,形成所述抽取的關鍵詞和/或模糊詞的特征數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶慧安鏈科技有限公司,未經重慶慧安鏈科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910331228.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:穿衣信息的共享方法、裝置和終端
- 下一篇:一種資訊推送方法及裝置





