[發(fā)明專利]數(shù)據(jù)單元快速分段的方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201710651707.2 | 申請(qǐng)日: | 2017-08-02 |
| 公開(kāi)(公告)號(hào): | CN107506399B | 公開(kāi)(公告)日: | 2020-06-19 |
| 發(fā)明(設(shè)計(jì))人: | 房英明;劉杰 | 申請(qǐng)(專利權(quán))人: | 攜程旅游網(wǎng)絡(luò)技術(shù)(上海)有限公司 |
| 主分類號(hào): | G06F16/22 | 分類號(hào): | G06F16/22 |
| 代理公司: | 上海隆天律師事務(wù)所 31282 | 代理人: | 臧云霄;鐘宗 |
| 地址: | 200335 上海市長(zhǎng)*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 單元 快速 分段 方法 系統(tǒng) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種數(shù)據(jù)單元快速分段的方法,用于將待分段的數(shù)據(jù)單元中的表示相同屬性參數(shù)的目標(biāo)字段在海量數(shù)據(jù)單元中進(jìn)行快速分段,其特征在于,包括以下步驟:
S101、將海量數(shù)據(jù)單元隨機(jī)分割為多個(gè)數(shù)據(jù)小組,每個(gè)所述數(shù)據(jù)單元包括表述不同屬性參數(shù)的多個(gè)字段;
S102、隨機(jī)挑選每個(gè)數(shù)據(jù)小組中的多個(gè)數(shù)據(jù)單元;
S103、分別獲得每個(gè)數(shù)據(jù)小組中被選中的所述多個(gè)數(shù)據(jù)單元與所述目標(biāo)字段表示相同屬性參數(shù)的字段的平均值,并將所述平均值作為所述數(shù)據(jù)小組的目標(biāo)字段參考值;
S104、根據(jù)所述目標(biāo)字段參考值的大小對(duì)所有所述數(shù)據(jù)小組進(jìn)行排序;
S105、根據(jù)預(yù)設(shè)的數(shù)據(jù)分段方向和分段比例關(guān)系,結(jié)合排序結(jié)果,對(duì)所述數(shù)據(jù)小組進(jìn)行數(shù)據(jù)分段,每個(gè)所述數(shù)據(jù)分段預(yù)存有至少一對(duì)應(yīng)的推送信息;
S106、將相鄰的兩個(gè)數(shù)據(jù)分段的兩個(gè)相鄰接的所述數(shù)據(jù)小組的目標(biāo)字段參考值的平均值作為數(shù)據(jù)分段的分割點(diǎn);
S107、當(dāng)待分段的數(shù)據(jù)單元的字段的數(shù)值位于相鄰的兩個(gè)數(shù)據(jù)分段的分割點(diǎn)之間,則所述待分段的數(shù)據(jù)單元的目標(biāo)字段歸屬于兩個(gè)數(shù)據(jù)分段的分割點(diǎn)之間的數(shù)據(jù)分段之中,向所述待分段的數(shù)據(jù)單元的用戶推送其所屬數(shù)據(jù)分段的推送信息。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)單元快速分段的方法,其特征在于:每個(gè)數(shù)據(jù)小組包含的數(shù)據(jù)單元的數(shù)量相等。
3.根據(jù)權(quán)利要求1所述的數(shù)據(jù)單元快速分段的方法,其特征在于:所述步驟S102中,被挑選的所述數(shù)據(jù)單元占所述每個(gè)數(shù)據(jù)小組中數(shù)據(jù)單元的10%至40%。
4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)單元快速分段的方法,其特征在于:所述被挑選的數(shù)據(jù)單元占所述每個(gè)數(shù)據(jù)小組中數(shù)據(jù)單元的20%至30%。
5.根據(jù)權(quán)利要求1所述的數(shù)據(jù)單元快速分段的方法,其特征在于:所述步驟S105中,所述數(shù)據(jù)分段方向是自大到小,所述數(shù)據(jù)分段比例關(guān)系是25%;25%;25%;25%,則按照排序的順序,對(duì)所述數(shù)據(jù)小組進(jìn)行數(shù)據(jù)分段,第一數(shù)據(jù)分段占據(jù)目標(biāo)字段參考值自大到小排序中的最前的25%的位次的所述數(shù)據(jù)小組;
第二數(shù)據(jù)分段占據(jù)目標(biāo)字段參考值自大到小排序中位于26%至50%的位次的所述數(shù)據(jù)小組;
第三數(shù)據(jù)分段占據(jù)目標(biāo)字段參考值自大到小排序中位于51%至75%的位次的所述數(shù)據(jù)小組;以及
第四數(shù)據(jù)分段占據(jù)目標(biāo)字段參考值自大到小排序中最后的25%的位次的所述數(shù)據(jù)小組。
6.根據(jù)權(quán)利要求1所述的數(shù)據(jù)單元快速分段的方法,其特征在于:所述步驟S105中,所述數(shù)據(jù)分段方向是自大到小,所述數(shù)據(jù)分段比例關(guān)系是5%;10%;20%;40%;25%,則按照排序的順序,對(duì)所述數(shù)據(jù)小組進(jìn)行數(shù)據(jù)分段,第一數(shù)據(jù)分段占據(jù)目標(biāo)字段參考值自大到小排序中的最前的5%的位次的所述數(shù)據(jù)小組;
第二數(shù)據(jù)分段占據(jù)目標(biāo)字段參考值自大到小排序中位于6%至15%的位次的所述數(shù)據(jù)小組;
第三數(shù)據(jù)分段占據(jù)目標(biāo)字段參考值自大到小排序中位于16%至35%的位次的所述數(shù)據(jù)小組;
第四數(shù)據(jù)分段占據(jù)目標(biāo)字段參考值自大到小排序中位于36%至75%的位次的所述數(shù)據(jù)小組;
第五數(shù)據(jù)分段占據(jù)目標(biāo)字段參考值自大到小排序中最后的25%的位次的所述數(shù)據(jù)小組。
7.根據(jù)權(quán)利要求1所述的數(shù)據(jù)單元快速分段的方法,其特征在于:所述步驟S106替換為根據(jù)預(yù)設(shè)的數(shù)據(jù)分段的比例關(guān)系,結(jié)合排序結(jié)果,將相鄰的兩個(gè)數(shù)據(jù)分段的兩個(gè)鄰接的所述數(shù)據(jù)小組的目標(biāo)字段參考值中的任意一個(gè)作為數(shù)據(jù)分段的分割點(diǎn)。
8.根據(jù)權(quán)利要求1所述的數(shù)據(jù)單元快速分段的方法,其特征在于:所述屬性參數(shù)是用戶的年齡、年收入、訪問(wèn)網(wǎng)站次數(shù)、歷史下單次數(shù)、學(xué)歷參考值、預(yù)定酒店次數(shù)、預(yù)訂旅游行程次數(shù)、預(yù)訂機(jī)票次數(shù)、預(yù)定游輪次數(shù)、網(wǎng)購(gòu)月消費(fèi)金額中的一種。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于攜程旅游網(wǎng)絡(luò)技術(shù)(上海)有限公司,未經(jīng)攜程旅游網(wǎng)絡(luò)技術(shù)(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710651707.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





