[發(fā)明專利]識別常見關(guān)聯(lián)關(guān)系的方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010219522.6 | 申請日: | 2020-03-25 |
| 公開(公告)號: | CN111581235B | 公開(公告)日: | 2021-08-03 |
| 發(fā)明(設(shè)計)人: | 李君陽 | 申請(專利權(quán))人: | 貝殼找房(北京)科技有限公司 |
| 主分類號: | G06F16/245 | 分類號: | G06F16/245 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 張秀程 |
| 地址: | 100085 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 識別 常見 關(guān)聯(lián) 關(guān)系 方法 系統(tǒng) | ||
1.一種識別常見關(guān)聯(lián)關(guān)系的方法,其特征在于,包括:
從數(shù)據(jù)庫中選取基礎(chǔ)樣本,所述數(shù)據(jù)庫中的樣本均記錄M種標(biāo)識,所述基礎(chǔ)樣本記錄的m種標(biāo)識在所述數(shù)據(jù)庫中呈多關(guān)聯(lián)關(guān)系;
將所述基礎(chǔ)樣本的m種標(biāo)識中的第i種標(biāo)識作為第一標(biāo)識,將所述基礎(chǔ)樣本中除所述第一標(biāo)識外的任意一種標(biāo)識作為第二標(biāo)識;
從數(shù)據(jù)庫中查找與所述基礎(chǔ)樣本的第一標(biāo)識關(guān)聯(lián)的N個樣本,結(jié)合所述基礎(chǔ)樣本構(gòu)建第一樣本集,從數(shù)據(jù)庫中獲取第二樣本集,所述第二樣本集中的樣本記錄的M種標(biāo)識在所述數(shù)據(jù)庫中呈唯一關(guān)聯(lián)關(guān)系;
獲取所述第一樣本集和第二樣本集中所有樣本的用戶行為日志,根據(jù)所述用戶行為日志,從第一樣本集中確定目標(biāo)樣本,所述目標(biāo)樣本為用于表征所述第一標(biāo)識與所述第二標(biāo)識呈常見關(guān)聯(lián)關(guān)系的樣本;
其中,1≤i≤m;2≤M;m≤M;1≤N;i、m、M和N均為整數(shù);
如果一個樣本記錄的所有標(biāo)識均沒有出現(xiàn)在其他樣本記錄的標(biāo)識中,則所述樣本記錄的M種標(biāo)識在所述數(shù)據(jù)庫中呈唯一關(guān)聯(lián)關(guān)系;如果一個樣本記錄的某種標(biāo)識存在和其他樣本記錄的標(biāo)識相同,則所述標(biāo)識在數(shù)據(jù)庫中呈多關(guān)聯(lián)關(guān)系;常見關(guān)聯(lián)關(guān)系是指標(biāo)識在某一個樣本中出現(xiàn)的情況,相比其他樣本更常見。
2.根據(jù)權(quán)利要求1所述的識別常見關(guān)聯(lián)關(guān)系的方法,其特征在于,所述根據(jù)所述用戶行為日志,從第一樣本集中確定目標(biāo)樣本,具體為:
根據(jù)所述第一樣本集中的樣本的用戶行為日志以及所述第二樣本集中所有樣本的用戶行為日志,計算所述第一樣本集中的樣本與所述第二樣本集的相似度,作為所述第一樣本集中的樣本記錄的第一標(biāo)識與第二標(biāo)識呈常見關(guān)聯(lián)關(guān)系的概率,將第一樣本集中具有最高概率的樣本作為所述目標(biāo)樣本。
3.根據(jù)權(quán)利要求2所述的識別常見關(guān)聯(lián)關(guān)系的方法,其特征在于,所述計算所述第一樣本集中的樣本與所述第二樣本集的相似度,具體為:
對所述第一樣本集和第二樣本集中的樣本,根據(jù)所述樣本的用戶行為日志,獲得所述樣本的樣本特征;
根據(jù)所述第二樣本集中樣本的樣本特征獲得所述第二樣本集的樣本特征;
計算所述第一樣本集中樣本的樣本特征與所述第二樣本集的樣本特征的相似度,獲得所述第一樣本集中的樣本與所述第二樣本集的相似度。
4.根據(jù)權(quán)利要求3所述的識別常見關(guān)聯(lián)關(guān)系的方法,其特征在于,所述根據(jù)所述第二樣本集中樣本的樣本特征獲得所述第二樣本集的樣本特征,具體為:
將所述第二樣本集中所有樣本的樣本特征的平均值作為所述第二樣本集的樣本特征。
5.根據(jù)權(quán)利要求3或4所述的識別常見關(guān)聯(lián)關(guān)系的方法,其特征在于,所述第一樣本集中樣本的樣本特征與所述第二樣本集的樣本特征的相似度以余弦相似度、歐氏距離、馬氏距離中的一種進(jìn)行表征。
6.根據(jù)權(quán)利要求1-4任意一項所述的識別常見關(guān)聯(lián)關(guān)系的方法,其特征在于,所述用戶行為日志包括:預(yù)設(shè)時間內(nèi)的使用總次數(shù)、白天使用次數(shù)、夜間使用次數(shù)、首次和末次使用間隔、末次使用距今間隔、近7天使用次數(shù)、近15天使用次數(shù)、近30天使用次數(shù)、周使用平均次數(shù)、周使用最小次數(shù)和周使用最大次數(shù);所述預(yù)設(shè)時間至少為30天。
7.根據(jù)權(quán)利要求1-4任意一項所述的識別常見關(guān)聯(lián)關(guān)系的方法,其特征在于,所述從第一樣本集中確定目標(biāo)樣本,之后還包括:
構(gòu)建連通圖,所述連通圖中的節(jié)點為數(shù)據(jù)庫中樣本的標(biāo)識,樣本通過所述連通圖中首尾不相連的M個節(jié)點連接成的多段線進(jìn)行表征,相同的標(biāo)識共用一個節(jié)點;
若所述連通圖中的節(jié)點連接至少兩個同一種標(biāo)識的其他節(jié)點,則計算所述節(jié)點與所述至少兩個同一種標(biāo)識的其他節(jié)點間的相似度;
在所述連通圖中獲取所有連通分量,若連通分量中的節(jié)點連接至少兩個同一種標(biāo)識的其他節(jié)點,則僅保留所述連通分量中的節(jié)點與最大相似度的其他節(jié)點的連線,以獲得重構(gòu)后的連通圖;
根據(jù)重構(gòu)后的連通圖確定數(shù)據(jù)庫中記錄的所有用戶以及用戶的所有常用標(biāo)識。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于貝殼找房(北京)科技有限公司,未經(jīng)貝殼找房(北京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010219522.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 關(guān)聯(lián)裝置
- 數(shù)據(jù)關(guān)聯(lián)裝置和數(shù)據(jù)關(guān)聯(lián)方法
- 安全關(guān)聯(lián)
- 設(shè)備關(guān)聯(lián)
- 終端關(guān)聯(lián)裝置和終端關(guān)聯(lián)方法
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)分析方法和關(guān)聯(lián)分析系統(tǒng)
- 報文關(guān)聯(lián)方法、報文關(guān)聯(lián)裝置及報文關(guān)聯(lián)系統(tǒng)





