[發明專利]數據聚類方法和系統、數據存儲方法和系統以及存儲介質有效
| 申請號: | 202011292917.5 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN114519101B | 公開(公告)日: | 2023-06-06 |
| 發明(設計)人: | 莫元武;K·斯洛芬;蔡純鋼;馮杰;王景龍;熊輝 | 申請(專利權)人: | 易保網絡技術(上海)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 上海華誠知識產權代理有限公司 31300 | 代理人: | 徐穎聰 |
| 地址: | 200433 上海市楊浦區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 方法 系統 存儲 以及 介質 | ||
1.一種數據聚類方法,包括:
解析歷史聚類數據并據其各部分的性質將其分解成聚類原子,所述聚類原子關聯到其所屬的歷史聚類數據的聚類屬性中的至少一者,其中,所述聚類原子以圖數據庫形式組織并存儲在聚類原子池中,所述歷史聚類數據是具有可重新組織的聚類原子的應用數據,所述應用數據包括廣告宣傳文本、法律文本、協議文本、程序代碼和用于構建保險理財合同的原始產品中的至少一者;
根據所述聚類原子的性質形成聚類原子池,所述聚類原子池中包括所述聚類原子的非結構化關系;
從所述聚類原子池查找所述聚類原子以構成備選聚類原子,所述查找基于目標聚類數據的目標聚類屬性、所述聚類原子關聯的聚類屬性和所述聚類原子的性質;以及
引用所述備選聚類原子形成所述目標聚類數據。
2.根據權利要求1所述的方法,所述歷史聚類數據為歷史語料聚類數據,所述聚類原子為語料聚類原子。
3.根據權利要求2所述的方法,所述查找還基于語料匹配。
4.根據權利要求1所述的方法,所述查找基于圖搜索方法。
5.根據權利要求1所述的方法,所述聚類原子存在層級關系,其中:
將上級聚類原子作為所述備選聚類原子的同時也將其下級聚類原子作為所述備選聚類原子;以及
通過作為所述備選聚類原子的下級聚類原子能夠上溯其上級聚類原子,并將所述上級聚類原子作為所述備選聚類原子。
6.根據權利要求1所述的方法,所述聚類屬性包括:對象、種類、地區、性別、年齡、期間。
7.根據權利要求1所述的方法,若所引用的備選聚類原子之間不兼容,則產生提示信息。
8.一種數據存儲方法,包括:
解析歷史聚類數據并據其各部分的性質將其分解成聚類原子,所述聚類原子關聯到其所屬的歷史聚類數據的聚類屬性中的至少一者,其中,所述歷史聚類數據是具有可重新組織的聚類原子的應用數據,所述應用數據包括廣告宣傳文本、法律文本、協議文本、程序代碼和用于構建保險理財合同的原始產品中的至少一者;以及
根據所述聚類原子的性質形成聚類原子池,所述聚類原子池中包括所述聚類原子的非結構化關系,其中,所述聚類原子以圖數據庫形式組織并存儲在所述聚類原子池中,以使得所述聚類原子池中的聚類原子被查找以構成備選聚類原子,所述查找基于目標聚類數據的目標聚類屬性、所述聚類原子關聯的聚類屬性和所述聚類原子的性質,并引用所述備選聚類原子形成目標聚類數據。
9.根據權利要求8所述的方法,所述歷史聚類數據為歷史語料聚類數據,所述聚類原子為語料聚類原子。
10.根據權利要求8所述的方法,所述聚類屬性包括:對象、種類、地區、性別、年齡、期間。
11.一種計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有指令,其特征在于,當所述指令由處理器執行時,使得所述處理器執行如權利要求1-10中任一項所述的方法。
12.一種數據聚類系統,包括:
解析單元,其配置成解析歷史聚類數據并據其各部分的性質將其分解成聚類原子,所述聚類原子關聯到其所屬的歷史聚類數據的聚類屬性中的至少一者,其中,所述聚類原子以圖數據庫形式組織并存儲在聚類原子池中,所述歷史聚類數據是具有可重新組織的聚類原子的應用數據,所述應用數據包括廣告宣傳文本、法律文本、協議文本、程序代碼和用于構建保險理財合同的原始產品中的至少一者;
池化單元,其配置成根據所述聚類原子的性質形成聚類原子池,所述聚類原子池中包括所述聚類原子的非結構化關系;
查找單元,其配置成從所述池化單元中查找所述聚類原子以構成備選聚類原子,所述查找基于目標聚類數據的目標聚類屬性、所述聚類原子關聯的聚類屬性和所述聚類原子的性質;以及
組裝單元,其配置成引用所述備選聚類原子形成所述目標聚類數據。
13.一種數據存儲系統,包括:
解析單元,其配置成根解析歷史聚類數據并據其各部分的性質將其分解成聚類原子,所述聚類原子關聯到其所屬的歷史聚類數據的聚類屬性中的至少一者,其中,所述歷史聚類數據是具有可重新組織的聚類原子的應用數據,所述應用數據包括廣告宣傳文本、法律文本、協議文本、程序代碼和用于構建保險理財合同的原始產品中的至少一者;以及
存儲單元,其配置成根據所述聚類原子的性質形成聚類原子池,所述聚類原子池中包括所述聚類原子的非結構化關系,其中,所述聚類原子以圖數據庫形式組織并存儲在所述聚類原子池中,以使得所述聚類原子池中的聚類原子被查找以構成備選聚類原子,所述查找基于目標聚類數據的目標聚類屬性、所述聚類原子關聯的聚類屬性和所述聚類原子的性質,并引用所述備選聚類原子形成目標聚類數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于易保網絡技術(上海)有限公司,未經易保網絡技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011292917.5/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





