[發明專利]提取對象特征、搜索對象的方法和裝置在審
| 申請號: | 201810073340.5 | 申請日: | 2018-01-25 |
| 公開(公告)號: | CN110110267A | 公開(公告)日: | 2019-08-09 |
| 發明(設計)人: | 陳賤輝;邵榮防;郝暉;李蕭蕭;史亞妮 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06F16/951 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 張一軍;楊曉偉 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征信息 對象特征 方法和裝置 搜索對象 特征詞 計算機技術領域 特征詞提取 預定時間段 對象關聯 對象搜索 分詞處理 搜索效率 特征表 分詞 詞語 搜索 | ||
本發明公開了一種提取對象特征、搜索對象的方法和裝置,涉及計算機技術領域。該方法的一具體實施方式包括:獲取預定時間段內對象的特征信息;其中,特征信息至少包括第一特征信息以及第二特征信息;對第一特征信息進行分詞處理,根據分詞后各個詞語的數量以及預定的第一特征詞提取規則,確定對象的特征詞;根據第二特征信息以及預定的對象值確定規則,確定對象在當前時間的對象值;至少基于特征詞以及對象值,生成與對象關聯的特征表。該實施方式提供了一種提取對象特征的思路,便于后續依據對象特征進行對象搜索,使得搜索更具有針對性,進而提高對于該對象的搜索效率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種提取對象特征、搜索對象的方法和裝置。
背景技術
隨著人們生活水平的提高以及移動互聯網的發展,人們隨時隨地都能在購物網站上進行購物,網購已成為當下最為流行的一種購物方式。目前在購物平臺中包括各種商品排序的體制,通常通過商品信息的完整度,檢索字段文本相似度、商品點擊數、搜索量、訂單數、好評率、用戶行為偏好等因子計算排序權重,所得排序對于商品導流、提高商品銷量起到至關重要的作用。
在實現本發明過程中,發明人發現現有技術至少存在如下問題:
(1)現有的排序因子通常基于歷史數據產生,但由于新上架的商品沒有或缺少這些因子的基礎數據,導致排序靠后難以獲得流量,從而引發賣家通過刷單等非正常手段提高商品權重,進而對電商平臺和社會信用產生不良影響。
(2)現有的排序方法需要一個數據累加的過程,但對于時效性、季節性明顯的商品,可能存在即使累加到權重也失去時效性的現象,不利于該商品的銷售。
發明內容
有鑒于此,本發明實施例提供一種提取對象特征、搜索對象的方法和裝置,至少能夠解決現有排序手段不適合新創建的對象以及時效明顯的對象的現象。
為實現上述目的,根據本發明實施例的一個方面,提供了一種提取對象特征的方法,其特征在于,包括:獲取預定時間段內對象的特征信息;其中,所述特征信息至少包括第一特征信息以及第二特征信息;對所述第一特征信息進行分詞處理,根據分詞后各個詞語的數量以及預定的第一特征詞提取規則,確定所述對象的特征詞;根據所述第二特征信息以及預定的對象值確定規則,確定所述對象在當前時間的對象值;至少基于所述特征詞以及所述對象值,生成與所述對象關聯的特征表。
可選的,所述根據分詞后各個詞語的數量以及預定的第一特征詞提取規則,確定所述對象的特征詞包括:根據預定的第一衰減公式,確定分詞后各個詞語的第一衰減值,提取第一衰減值超出預定衰減閾值的詞語為所述對象的所述特征詞。
可選的,所述第二特征信息至少包括所述對象的創建時間以及歷史日志信息;所述根據所述第二特征信息以及預定的對象值確定規則,確定所述對象在當前時間的對象值包括:根據所述對象的創建時間以及預定的第二衰減公式,確定所述對象的熱度在當前時間的第二衰減值;根據所述對象的歷史日志信息以及預定的反饋值確定方式,確定所述對象在當前時間的反饋值;根據所述第二衰減值以及所述反饋值,確定所述對象在當前時間的所述對象值。
為實現上述目的,根據本發明實施例的另一個方面,提供了一種搜索對象的方法,其特征在于,包括:利用上述任一項所述的提取對象特征的方法,生成與所述對象關聯的特征表;以及接收搜索請求,根據預定的第二特征詞提取規則,確定所述搜索請求中的第一特征詞;當所述第一特征詞在所述特征表中時,獲取符合所述搜索請求的第一對象;獲取每個第一對象的對象值,提取對象值超出預定對象值閾值的第一對象并發送。
可選的,還包括:獲取每個第一對象的創建時間,確定創建時間與當前時間之差在預定間距范圍內的第一對象優先排列。
可選的,所述第二特征詞提取規則至少包括所述第一特征詞提取規則以及歸一化規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810073340.5/2.html,轉載請聲明來源鉆瓜專利網。





