[發明專利]一種主播的搜索方法和裝置在審
| 申請號: | 202011522266.4 | 申請日: | 2020-12-21 |
| 公開(公告)號: | CN112579899A | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 羅航;王學超 | 申請(專利權)人: | 杭州米絡星科技(集團)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 安衛靜 |
| 地址: | 310000 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 搜索 方法 裝置 | ||
1.一種主播的搜索方法,其特征在于,包括:
采集主播的主播信息,并基于所述主播信息和預設關鍵詞,構建數據庫,其中,所述預設關鍵詞包括以下至少之一:主播所屬家族的家族昵稱,主播昵稱的近義詞,所述主播信息包括:主播的基本信息和主播的房間信息;
在獲取到用戶輸入的關鍵字之后,對所述關鍵字進行預處理,得到關鍵信息;
基于所述關鍵信息、所述數據庫和BM25算法,確定出主播列表;
對所述主播列表中的主播進行排序,得到搜索結果。
2.根據權利要求1所述的方法,其特征在于,對所述關鍵字進行預處理,得到關鍵信息,包括:
對所述關鍵字進行細粒度拆分,得到多個字段;
將所述多個字段確定為所述關鍵信息。
3.根據權利要求2所述的方法,其特征在于,若所述關鍵字為主播昵稱,則所述多個字段包括:第一字段和第二字段,將所述多個字段確定為所述關鍵信息包括:
對所述第一字段進行極細粒度拆分,得到多個文字;
對所述第二字段進行粗粒度拆分,得到多個字節;
將所述多個文字和所述多個字節,確定為所述關鍵信息。
4.根據權利要求1所述的方法,其特征在于,對所述主播列表中的主播進行排序,得到搜索結果,包括:
確定出所述主播列表中的主播的主播參數,其中,所述主播參數包括但不限于:開播狀態,當前房間觀眾數量;
基于所述主播信息和所述主播信息對應的權重,以及所述主播參數和所述主播參數對應的權重,計算出主播對應權重值;
基于所述權重值,對所述主播列表中的主播進行排序,得到排序結果;
將所述排序結果,確定為所述搜索結果。
5.根據權利要求1所述的方法,其特征在于,
所述基本信息包括但不限于:主播昵稱,主播所屬地區,主播等級;
所述房間信息包括但不限于:房間編號,直播內容,房間所屬的直播分區。
6.根據權利要求1所述的方法,其特征在于,所述方法還包括:
若獲取到修改信息,則對所述修改信息進行異步信息解耦,將完成異步信息解耦的修改信息同步至所述數據庫,其中,所述修改信息為對所述基本信息進行修改后的信息。
7.根據權利要求6所述的方法,其特征在于,采集主播的主播信息,包括:
按照預設頻率,采集主播的房間信息。
8.一種主播的搜索裝置,其特征在于,包括:采集單元,預處理單元,確定單元和排序單元,其中,
所述采集單元,用于采集主播的主播信息,并基于所述主播信息和預設關鍵詞,構建數據庫,其中,所述預設關鍵詞包括以下至少之一:主播所屬家族的家族昵稱,主播昵稱的近義詞,所述主播信息包括:主播的基本信息和主播的房間信息;
所述預處理單元,用于在獲取到用戶輸入的關鍵字之后,對所述關鍵字進行預處理,得到關鍵信息;
所述確定單元,用于基于所述關鍵信息、所述數據庫和BM25算法,確定出主播列表;
所述排序單元,用于對所述主播列表中的主播進行排序,得到搜索結果。
9.一種電子設備,其特征在于,包括存儲器以及處理器,所述存儲器用于存儲支持處理器執行權利要求1至7任一項所述方法的程序,所述處理器被配置為用于執行所述存儲器中存儲的程序。
10.一種計算機可讀存儲介質,計算機可讀存儲介質上存儲有計算機程序,其特征在于,計算機程序被處理器運行時執行上述權利要求1至7任一項所述方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州米絡星科技(集團)有限公司,未經杭州米絡星科技(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011522266.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種環保型陶瓷霧化器
- 下一篇:物聯網終端的自檢方法、裝置、終端及存儲介質





