[發(fā)明專利]一種地址聚合的方法以及設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201710092924.2 | 申請(qǐng)日: | 2017-02-21 |
| 公開(kāi)(公告)號(hào): | CN108460046A | 公開(kāi)(公告)日: | 2018-08-28 |
| 發(fā)明(設(shè)計(jì))人: | 王國(guó)印;鄭聳 | 申請(qǐng)(專利權(quán))人: | 菜鳥(niǎo)智能物流控股有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06Q10/08 |
| 代理公司: | 北京三友知識(shí)產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 黨曉林;李輝 |
| 地址: | 開(kāi)曼群島大開(kāi)曼*** | 國(guó)省代碼: | 開(kāi)曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 通信地址 聚合 特征集合 結(jié)構(gòu)化 相似度 數(shù)據(jù)處理技術(shù) 特征提取裝置 相似度確定 地址轉(zhuǎn)化 聚合裝置 特征提取 同一區(qū)域 申請(qǐng) 名字 轉(zhuǎn)化 | ||
1.一種地址聚合的方法,其特征在于,所述方法包括:
將多個(gè)通信地址轉(zhuǎn)化為多個(gè)結(jié)構(gòu)化地址;
對(duì)所述多個(gè)結(jié)構(gòu)化地址進(jìn)行特征提取,得到與所述多個(gè)通信地址對(duì)應(yīng)的多個(gè)特征集合,所述特征集合至少包括興趣區(qū)域的道路及路號(hào)信息和/或興趣區(qū)域的名字;
根據(jù)所述多個(gè)通信地址對(duì)應(yīng)的多個(gè)特征集合確定所述多個(gè)通信地址中任意兩個(gè)通信地址之間的相似度;
根據(jù)所述相似度將所述多個(gè)通信地址進(jìn)行聚合,得到多個(gè)簇。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將多個(gè)通信地址轉(zhuǎn)化為多個(gè)結(jié)構(gòu)化地址包括:
提取所述通信地址中的地名信息;
為每個(gè)所述地名信息加注語(yǔ)義標(biāo)注信息,所述語(yǔ)義標(biāo)注信息至少包括興趣區(qū)域的道路及路號(hào)信息和/或興趣區(qū)域的名字;
依據(jù)所述語(yǔ)義標(biāo)注信息將所述地名信息放入結(jié)構(gòu)化模板中,得到結(jié)構(gòu)化地址。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述多個(gè)通信地址對(duì)應(yīng)的多個(gè)特征集合確定所述通信地址中任意兩個(gè)通信地址之間的相似度包括:通過(guò)相似度公式確定所述多個(gè)通信地址中任意兩個(gè)通信地址之間的相似度。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)所述相似度將所述多個(gè)通信地址進(jìn)行聚合包括:
確定每個(gè)通信地址的相似通信地址;
判斷每個(gè)通信地址以及對(duì)應(yīng)的相似通信地址是否在簇中;
當(dāng)判斷為否時(shí),將所述通信地址以及對(duì)應(yīng)的相似通信地址加入到一新建的簇中;
否則,將所述通信地址以及對(duì)應(yīng)的相似通信地址加入所述簇中;
將所述新建的簇以及所述簇作為聚合后得到的多個(gè)簇。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述確定每個(gè)通信地址的相似通信地址包括:當(dāng)兩個(gè)通信地址之間的相似度大于或等于一預(yù)設(shè)閾值時(shí),將所述兩個(gè)通信地址作為相似通信地址。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括對(duì)所述多個(gè)簇進(jìn)行命名。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,對(duì)所述多個(gè)簇進(jìn)行命名包括:
獲取組成所述簇的多個(gè)通信地址對(duì)應(yīng)的特征集合;
根據(jù)所述特征集合依次確定每個(gè)道路及路號(hào)信息的頻次以及區(qū)域名稱的頻次;
將頻次最高的特征作為所述簇的名稱。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,對(duì)所述多個(gè)簇進(jìn)行命名包括:
獲取組成所述簇的多個(gè)通信地址對(duì)應(yīng)的特征集合;
從所述特征集合中篩選出多個(gè)區(qū)域名稱;
將實(shí)際使用頻率最高的區(qū)域名稱作為所述簇的名稱。
9.一種地址聚合的設(shè)備,其特征在于,所述設(shè)備包括:
地址轉(zhuǎn)化裝置,用于將多個(gè)通信地址轉(zhuǎn)化為多個(gè)結(jié)構(gòu)化地址;
特征提取裝置,用于對(duì)所述多個(gè)結(jié)構(gòu)化地址進(jìn)行特征提取,得到與所述多個(gè)通信地址對(duì)應(yīng)的多個(gè)特征集合,所述特征集合至少包括興趣區(qū)域的道路及路號(hào)信息和/或興趣區(qū)域的名稱;
相似度確定裝置,用于根據(jù)所述多個(gè)通信地址對(duì)應(yīng)的多個(gè)特征集合確定所述通信地址中任意兩個(gè)通信地址之間的相似度;
地址聚合裝置,用于根據(jù)所述相似度將所述多個(gè)通信地址進(jìn)行聚合,得到多個(gè)簇。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于,所述地址轉(zhuǎn)化裝置用于:提取所述通信地址中的地名信息;為每個(gè)所述地名信息加注語(yǔ)義標(biāo)注信息,所述語(yǔ)義標(biāo)注信息至少包括興趣區(qū)域的道路及路號(hào)信息和/或興趣區(qū)域的名字;依據(jù)所述語(yǔ)義標(biāo)注信息將所述地名信息放入結(jié)構(gòu)化模板中,得到結(jié)構(gòu)化地址。
11.根據(jù)權(quán)利要求10所述的設(shè)備,其特征在于,所述相似度確定裝置通過(guò)相似度公式確定所述多個(gè)通信地址中任意兩個(gè)通信地址之間的相似度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于菜鳥(niǎo)智能物流控股有限公司,未經(jīng)菜鳥(niǎo)智能物流控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710092924.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 通信地址檢測(cè)裝置、具有內(nèi)置控制電路的連接器及通信地址檢測(cè)方法
- 一種通信地址顯示方法以及一種通信地址顯示裝置
- 一種通信方法、裝置及系統(tǒng)
- 移動(dòng)通信終端中通信地址的處理方法及移動(dòng)通信終端
- 一種會(huì)議邀請(qǐng)方法及其裝置
- 一種分配通信地址的方法及裝置
- 設(shè)置匯流箱地址信息的方法、設(shè)備、存儲(chǔ)介質(zhì)及發(fā)電系統(tǒng)
- 一種低壓集抄通信系統(tǒng)的通信方法、裝置、系統(tǒng)及介質(zhì)
- 溫控器通信地址分配方法及系統(tǒng)
- 通信地址知識(shí)庫(kù)的生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 用于使文本結(jié)構(gòu)化的方法和裝置
- 用于地下儲(chǔ)層模擬的系統(tǒng)和方法
- 文檔結(jié)構(gòu)化方法和裝置
- 一種將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)的方法及裝置
- 一種基于事件的半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)采集系統(tǒng)
- 文本結(jié)構(gòu)化方法、裝置、系統(tǒng)和非易失性存儲(chǔ)介質(zhì)
- 信息關(guān)聯(lián)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本結(jié)構(gòu)化方法、裝置、系統(tǒng)和非易失性存儲(chǔ)介質(zhì)
- 結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)方法、裝置、設(shè)備及介質(zhì)
- 一種融合結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的混合搜索方法





