[發明專利]一種燃氣卡數據與用戶管理數據的關聯方法有效
| 申請號: | 201810001148.5 | 申請日: | 2018-01-02 |
| 公開(公告)號: | CN108090221B | 公開(公告)日: | 2019-05-10 |
| 發明(設計)人: | 韓金麗;李洪根;張大兵;趙新磊 | 申請(專利權)人: | 北京市燃氣集團有限責任公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25;G06F16/35;G06F17/27 |
| 代理公司: | 北京天方智力知識產權代理事務所(普通合伙) 11719 | 代理人: | 谷成 |
| 地址: | 100035 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卡數據 用戶管理數據 地址數據 燃氣 關聯 地址分詞 分詞結果 民用燃氣 用戶管理系統 人工工作量 地址匹配 數據合并 業務管理 有效實現 卡系統 相似度 分詞 預設 優化 抽取 規范化 | ||
1.一種燃氣卡數據與用戶管理數據的關聯方法,其特征在于:所述關聯方法包括如下步驟,
步驟1,從民用燃氣卡系統數據源中抽取燃氣卡數據,并從用戶管理系統數據源中抽取用戶管理數據;其中,所述燃氣卡數據中具有用戶第一地址數據,所述用戶管理數據中具有用戶第二地址數據;
利用相似度匹配計算的匹配信息進行用戶聚類;步驟2,對所述用戶第一地址數據進行分詞操作,從而得到地址分詞結果,且地址分詞結果中的每條分詞結果數據由多個字段組成;
步驟3,通過計算編輯距離的方式進行相似度值的比較并采用聚類的方法優化將潛在的可能重復的分詞結果數據調整到臨近的位置,判斷所述地址分詞結果中的任意兩條分詞結果數據的字段的第一相似度,如果所述第一相似度大于第一預設值,則將這兩條分詞結果數據合并為一條分詞結果數據,從而得到優化后的地址分詞結果;
步驟4,將所述優化后的地址分詞結果與所述用戶第二地址數據進行地址匹配,并在匹配成功的情況下將相對應的燃氣卡數據與用戶管理數據進行關聯;
所述步驟4中,地址匹配后,如果同時存在匹配失敗的優化后的地址分詞結果和用戶第二地址數據,則所述關聯方法還包括如下步驟:
步驟5,讀取相互間沒有關聯的剩余的燃氣卡數據和剩余的用戶管理數據,將剩余的燃氣卡數據與剩余的用戶管理數據進行相似度匹配,如果經過相似度匹配計算出的第二相似度大于第二預設值,則將相對應的燃氣卡數據與用戶管理數據進行關聯;
所述步驟5中,剩余的燃氣卡數據與剩余的用戶管理數據進行相似度匹配時,用于相似度匹配計算的匹配信息包括聯系人信息、聯系電話信息、用氣性質信息、備注信息、繳費記錄信息中的至少一種;
步驟6,對相互關聯的燃氣卡數據與用戶管理數據進行核驗,將核驗通過的燃氣卡數據導入用戶管理系統中,將核驗未通過的燃氣卡數據返回至民用燃氣卡系統數據源中。
2.根據權利要求1所述的燃氣卡數據與用戶管理數據的關聯方法,其特征在于:
步驟2中,還包括對分詞后的用戶第一地址數據進行統一地址編碼的步驟,以使編碼后的用戶第一地址數據與所述用戶第二地址數據具有相同格式的地址編碼。
3.根據權利要求2所述的燃氣卡數據與用戶管理數據的關聯方法,其特征在于:
步驟2中,識別所述用戶第一地址數據中的特殊字符,并以特征字符作為分詞依據、對所述用戶第一地址數據中的每條地址數據分別進行分詞操作;其中,所述特殊字符包括行政區域信息、街道信息、小區信息、樓信息、單元信息及門牌號信息,所述每條分詞結果數據由六個以內字段組成。
4.根據權利要求3所述的燃氣卡數據與用戶管理數據的關聯方法,其特征在于:
步驟2中,基于事先構建的元數據庫識別所述用戶第一地址數據中的特殊字符,所述元數據庫中存儲有標準地址數據,且所述標準地址數據中包含與地址相關的所有種類的特殊字符。
5.根據權利要求4所述的燃氣卡數據與用戶管理數據的關聯方法,其特征在于:
步驟3中,將地址分詞結果中的所有分詞結果數據進行全排列,通過字符串匹配的方式計算相鄰兩條分詞結果數據的字段的第一相似度,如果所述第一相似度大于第一預設值,則將這兩條相鄰的分詞結果數據合并為一條分詞結果數據。
6.根據權利要求1或5所述的燃氣卡數據與用戶管理數據的關聯方法,其特征在于:
步驟1中,在抽取燃氣卡數據和抽取用戶管理數據的過程中,均采用批量和增量的抽取方式。
7.根據權利要求1或5所述的燃氣卡數據與用戶管理數據的關聯方法,其特征在于:被抽取的燃氣卡數據包括用戶的地址數據、開卡數據、購氣數據、補卡數據及補氣數據,被抽取的用戶管理數據包括用戶的地址數據、表具數據及安檢數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市燃氣集團有限責任公司,未經北京市燃氣集團有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810001148.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:興趣點搜索排序方法及系統
- 下一篇:一種數據庫集群節點間數據同步系統





