[發(fā)明專(zhuān)利]基于拍搜行為預(yù)測(cè)用戶(hù)所屬群組的方法、裝置和計(jì)算機(jī)設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202110485570.4 | 申請(qǐng)日: | 2021-04-30 |
| 公開(kāi)(公告)號(hào): | CN113204662A | 公開(kāi)(公告)日: | 2021-08-03 |
| 發(fā)明(設(shè)計(jì))人: | 崔寅生;王偉戌;陶揚(yáng);韓均雷;王辰成;李雨桐;潘東 | 申請(qǐng)(專(zhuān)利權(quán))人: | 作業(yè)幫教育科技(北京)有限公司 |
| 主分類(lèi)號(hào): | G06F16/53 | 分類(lèi)號(hào): | G06F16/53;G06F16/958;G06K9/62 |
| 代理公司: | 北京清誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 11691 | 代理人: | 喻穎 |
| 地址: | 100085 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 行為 預(yù)測(cè) 用戶(hù) 所屬 方法 裝置 計(jì)算機(jī) 設(shè)備 | ||
1.一種基于拍搜行為預(yù)測(cè)用戶(hù)所屬群組的方法,所述拍搜行為是指發(fā)起照片搜索請(qǐng)求并獲得搜索結(jié)果的行為,其特征在于,所述方法包括如下步驟:
將用戶(hù)分成不同的集合,使同一集合中的用戶(hù)具有相同的群組信息,所述群組信息與用戶(hù)的拍搜行為相關(guān);
根據(jù)用戶(hù)的拍搜行為相似度水平,篩選出各集合中所述群組信息的置信度大于第一預(yù)設(shè)值的種子用戶(hù);
對(duì)于非種子用戶(hù),計(jì)算所述非種子用戶(hù)與各種子用戶(hù)的拍搜行為相似度,并根據(jù)所述相似度預(yù)測(cè)所述非種子用戶(hù)的所屬群組,所述非種子用戶(hù)包括缺失所述群組信息的用戶(hù)和所述集合中所述群組信息的置信度不大于第一預(yù)設(shè)值的用戶(hù)。
2.根據(jù)權(quán)利要求1所述的基于拍搜行為預(yù)測(cè)用戶(hù)所屬群組的方法,其特征在于,篩選所述種子用戶(hù)之前,所述方法還包括:將所述拍搜行為的搜索結(jié)果進(jìn)行標(biāo)簽化,并將標(biāo)簽化的搜索結(jié)果轉(zhuǎn)化為特征向量來(lái)表征用戶(hù)的拍搜行為;
后續(xù)基于所述特征向量計(jì)算所述用戶(hù)的拍搜行為相似度。
3.根據(jù)權(quán)利要求2所述的基于拍搜行為預(yù)測(cè)用戶(hù)所屬群組的方法,其特征在于,所述將所述拍搜行為的搜索結(jié)果進(jìn)行標(biāo)簽化,并將標(biāo)簽化的搜索結(jié)果轉(zhuǎn)化為特征向量,包括:
獲取用戶(hù)的歷史拍搜行為,并將所述歷史拍搜行為依據(jù)所對(duì)應(yīng)的搜索結(jié)果表征為標(biāo)簽序列,所述標(biāo)簽序列中的每個(gè)標(biāo)簽代表了所述搜索結(jié)果的至少一個(gè)特征;
將所述標(biāo)簽序列轉(zhuǎn)化為向量序列;
將所述向量序列歸一化為所述特征向量;
可選地,還包括:將用戶(hù)表征為其拍搜行為的特征向量:定義所述特征向量的名稱(chēng)為用戶(hù)標(biāo)識(shí),定義所述特征向量的長(zhǎng)度為用戶(hù)拍搜行為的特征表述;
可選地,將所述歷史拍搜行為依據(jù)對(duì)應(yīng)的搜索結(jié)果表征為標(biāo)簽序列,包括:對(duì)所述搜索結(jié)果進(jìn)行標(biāo)簽標(biāo)注;對(duì)標(biāo)注處理后的搜索結(jié)果數(shù)據(jù)進(jìn)行去重處理;
可選地,所述拍搜行為是指發(fā)起基于照片的搜題請(qǐng)求獲得搜題結(jié)果的行為;
可選地,所述照片為整頁(yè)拍照的整頁(yè)照片;所述標(biāo)簽序列包括:試題和書(shū)頁(yè);
可選地,所述群組信息包括下述中的至少一項(xiàng):用戶(hù)的所屬地域、學(xué)校、年級(jí)、班級(jí)、小組;
可選地,將所述拍搜行為的搜索結(jié)果進(jìn)行標(biāo)簽化的步驟中所生成的標(biāo)簽包括以下標(biāo)簽中的至少一種:教材、試卷、書(shū)本、習(xí)題冊(cè)、頁(yè)碼、試題。
4.根據(jù)權(quán)利要求2所述的基于拍搜行為預(yù)測(cè)用戶(hù)所屬群組的方法,其特征在于,所述篩選出種子用戶(hù)的步驟包括:
對(duì)所述特征向量進(jìn)行聚類(lèi)處理;將所述集合中的經(jīng)所述聚類(lèi)后得到的最大類(lèi)中的用戶(hù)作為所述種子用戶(hù);
可選地,在每個(gè)集合內(nèi)部使用社區(qū)發(fā)現(xiàn)算法對(duì)所述集合中用戶(hù)進(jìn)行所述聚類(lèi)處理。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的基于拍搜行為預(yù)測(cè)用戶(hù)所屬群組的方法,其特征在于,所述計(jì)算非種子用戶(hù)與各種子用戶(hù)的拍搜行為相似度之后,所述方法還包括:
篩選出與所述非種子用戶(hù)的相似度在預(yù)定范圍內(nèi)的種子用戶(hù);
預(yù)測(cè)該非種子用戶(hù)的所屬群組時(shí),根據(jù)篩選后的種子用戶(hù)的群組信息預(yù)測(cè)該非種子用戶(hù)的所屬群組或群組特征。
6.根據(jù)權(quán)利要求5所述的基于拍搜行為預(yù)測(cè)用戶(hù)所屬群組的方法,其特征在于,定義用戶(hù)空間,所述用戶(hù)空間中,以各用戶(hù)為頂點(diǎn),相鄰用戶(hù)間的相似關(guān)系為邊,相鄰用戶(hù)拍搜行為特征向量的相似度為邊的權(quán)重,篩選出所述群組信息的置信度大于第一預(yù)設(shè)值的種子用戶(hù)時(shí),使用Louvain社區(qū)發(fā)現(xiàn)算法對(duì)各集合中的用戶(hù)進(jìn)行聚類(lèi),以得到所述種子用戶(hù);
所述計(jì)算非種子用戶(hù)與各種子用戶(hù)的拍搜行為相似度包括:在所述用戶(hù)空間中,計(jì)算所述非種子用戶(hù)與各種子用戶(hù)的距離作為所述相似度;
所述篩選出與所述非種子用戶(hù)的相似度在預(yù)定范圍內(nèi)的種子用戶(hù)包括:
計(jì)算各集合中最大類(lèi)中任意兩個(gè)種子用戶(hù)的平均距離,
篩選出該非種子用戶(hù)與各集合的種子用戶(hù)之間的距離小于所述平均距離的種子用戶(hù)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于作業(yè)幫教育科技(北京)有限公司,未經(jīng)作業(yè)幫教育科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110485570.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 過(guò)濾以及監(jiān)控程序的行為的方法
- 數(shù)據(jù)挖掘的方法和裝置
- 網(wǎng)絡(luò)異常行為檢測(cè)方法及檢測(cè)裝置
- 基于大數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘的異常行為檢測(cè)方法和系統(tǒng)
- 用于檢測(cè)用戶(hù)行為的方法和裝置
- 行為數(shù)據(jù)分析方法及裝置
- 一種基于網(wǎng)絡(luò)的行為教育方法
- 網(wǎng)絡(luò)行為分類(lèi)方法、設(shè)備、存儲(chǔ)介質(zhì)及裝置
- 一種在線支付業(yè)務(wù)行為的異常檢測(cè)方法、裝置及電子設(shè)備
- 行為采集方法及系統(tǒng)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類(lèi)預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 用戶(hù)-用戶(hù)推薦器
- 用戶(hù)可定制配置的用戶(hù)終端及其用戶(hù)配置定制方法
- 用戶(hù)認(rèn)證方法、用戶(hù)認(rèn)證系統(tǒng)、用戶(hù)認(rèn)證裝置及用戶(hù)認(rèn)證程序
- 用戶(hù)認(rèn)證裝置、用戶(hù)認(rèn)證方法以及用戶(hù)認(rèn)證程序
- 用戶(hù)認(rèn)證裝置、用戶(hù)認(rèn)證方法以及用戶(hù)認(rèn)證程序
- 用戶(hù)接入方法及用戶(hù)設(shè)備
- 用戶(hù)管理方法、用戶(hù)管理系統(tǒng)和用戶(hù)終端
- 基于網(wǎng)絡(luò)的用戶(hù)對(duì)用戶(hù)交易
- 手機(jī)圖形用戶(hù)界面(用戶(hù)體系)
- 用戶(hù)認(rèn)證系統(tǒng)、用戶(hù)認(rèn)證服務(wù)器及用戶(hù)認(rèn)證方法





