[發(fā)明專利]數(shù)據(jù)聚類方法和系統(tǒng)、數(shù)據(jù)存儲(chǔ)方法和系統(tǒng)以及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202011292917.5 | 申請(qǐng)日: | 2020-11-18 |
| 公開(kāi)(公告)號(hào): | CN114519101B | 公開(kāi)(公告)日: | 2023-06-06 |
| 發(fā)明(設(shè)計(jì))人: | 莫元武;K·斯洛芬;蔡純鋼;馮杰;王景龍;熊輝 | 申請(qǐng)(專利權(quán))人: | 易保網(wǎng)絡(luò)技術(shù)(上海)有限公司 |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35 |
| 代理公司: | 上海華誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 31300 | 代理人: | 徐穎聰 |
| 地址: | 200433 上海市楊浦區(qū)*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 方法 系統(tǒng) 存儲(chǔ) 以及 介質(zhì) | ||
本申請(qǐng)涉及數(shù)據(jù)聚類方法和系統(tǒng)、數(shù)據(jù)存儲(chǔ)方法和系統(tǒng)以及存儲(chǔ)介質(zhì),所述數(shù)據(jù)聚類方法包括如下步驟:解析歷史聚類數(shù)據(jù)并據(jù)其各部分的性質(zhì)將其分解成聚類原子,所述聚類原子關(guān)聯(lián)到其所屬的歷史聚類數(shù)據(jù)的聚類屬性中的至少一者;根據(jù)所述聚類原子的性質(zhì)形成聚類原子池,所述聚類原子池中包括所述聚類原子的非結(jié)構(gòu)化關(guān)系;從所述聚類原子池查找所述聚類原子以構(gòu)成備選聚類原子,所述查找基于目標(biāo)聚類數(shù)據(jù)的目標(biāo)聚類屬性、所述聚類原子關(guān)聯(lián)的聚類屬性和所述聚類原子的性質(zhì);以及引用所述備選聚類原子形成所述目標(biāo)聚類數(shù)據(jù)。本申請(qǐng)的數(shù)據(jù)聚類方法可以提高聚類數(shù)據(jù)的效率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及數(shù)據(jù)加工領(lǐng)域,具體而言,涉及數(shù)據(jù)聚類方法和系統(tǒng)、數(shù)據(jù)存儲(chǔ)方法和系統(tǒng)以及存儲(chǔ)介質(zhì)。
背景技術(shù)
基于諸如語(yǔ)料數(shù)據(jù)的文本在很多時(shí)候都可以采納歷史文本中的內(nèi)容,若每次制作新的文本時(shí)都重新編寫(xiě)并組織語(yǔ)料則效率十分低下。此外,現(xiàn)成的語(yǔ)料數(shù)據(jù)一般都經(jīng)過(guò)較長(zhǎng)時(shí)間的檢驗(yàn),其穩(wěn)定性、準(zhǔn)確性較高,若重新編寫(xiě)文本恐難避免語(yǔ)義上的疏漏。
通常歷史文本中的語(yǔ)料數(shù)據(jù)是按照規(guī)則排列或者組織的,且這些語(yǔ)料數(shù)據(jù)之間也存在語(yǔ)義屬性上的關(guān)聯(lián),將這些語(yǔ)料數(shù)據(jù)作為材料并按照新的文本的要求來(lái)制作新的文本是可以考慮的方向。
發(fā)明內(nèi)容
本申請(qǐng)的實(shí)施例提供了一種數(shù)據(jù)聚類方法和系統(tǒng)、數(shù)據(jù)存儲(chǔ)方法和系統(tǒng)以及存儲(chǔ)介質(zhì),數(shù)據(jù)存儲(chǔ)方法和系統(tǒng)用于將歷史聚類數(shù)據(jù)打散成聚類原子并存儲(chǔ),數(shù)據(jù)聚類方法和系統(tǒng)可以進(jìn)一步根據(jù)聚類原子制作符合要求的新聚類數(shù)據(jù),從而提高聚類數(shù)據(jù)的效率、降低聚類數(shù)據(jù)時(shí)的錯(cuò)誤概率。
根據(jù)本申請(qǐng)的一方面,提供一種數(shù)據(jù)聚類方法,包括:解析歷史聚類數(shù)據(jù)并據(jù)其各部分的性質(zhì)將其分解成聚類原子,所述聚類原子關(guān)聯(lián)到其所屬的歷史聚類數(shù)據(jù)的聚類屬性中的至少一者;根據(jù)所述聚類原子的性質(zhì)形成聚類原子池,所述聚類原子池中包括所述聚類原子的非結(jié)構(gòu)化關(guān)系;從所述聚類原子池查找所述聚類原子以構(gòu)成備選聚類原子,所述查找基于目標(biāo)聚類數(shù)據(jù)的目標(biāo)聚類屬性、所述聚類原子關(guān)聯(lián)的聚類屬性和所述聚類原子的性質(zhì);以及引用所述備選聚類原子形成所述目標(biāo)聚類數(shù)據(jù)。
在本申請(qǐng)的一些實(shí)施例中,可選地,所述歷史聚類數(shù)據(jù)為歷史語(yǔ)料聚類數(shù)據(jù),所述聚類原子為語(yǔ)料聚類原子。
在本申請(qǐng)的一些實(shí)施例中,可選地,所述查找還基于語(yǔ)料匹配。
在本申請(qǐng)的一些實(shí)施例中,可選地,所述聚類原子以圖數(shù)據(jù)庫(kù)形式組織并存儲(chǔ)在聚類原子池中。
在本申請(qǐng)的一些實(shí)施例中,可選地,所述查找基于圖搜索方法。
在本申請(qǐng)的一些實(shí)施例中,可選地,所述聚類原子存在層級(jí)關(guān)系,其中:將上級(jí)聚類原子作為所述備選聚類原子的同時(shí)也將其下級(jí)聚類原子作為所述備選聚類原子;以及通過(guò)作為所述備選聚類原子的下級(jí)聚類原子能夠上溯其上級(jí)聚類原子,并將所述上級(jí)聚類原子作為所述備選聚類原子。
在本申請(qǐng)的一些實(shí)施例中,可選地,所述聚類屬性包括:對(duì)象、種類、地區(qū)、性別、年齡、期間。
在本申請(qǐng)的一些實(shí)施例中,可選地,若所引用的備選聚類原子之間不兼容,則產(chǎn)生提示信息。
根據(jù)本申請(qǐng)的一方面,提供一種數(shù)據(jù)存儲(chǔ)方法,包括:解析歷史聚類數(shù)據(jù)并據(jù)其各部分的性質(zhì)將其分解成聚類原子,所述聚類原子關(guān)聯(lián)到其所屬的歷史聚類數(shù)據(jù)的聚類屬性中的至少一者;以及根據(jù)所述聚類原子的性質(zhì)形成聚類原子池,所述聚類原子池中包括所述聚類原子的非結(jié)構(gòu)化關(guān)系。
在本申請(qǐng)的一些實(shí)施例中,可選地,所述歷史聚類數(shù)據(jù)為歷史語(yǔ)料聚類數(shù)據(jù),所述聚類原子為語(yǔ)料聚類原子。
在本申請(qǐng)的一些實(shí)施例中,可選地,所述聚類原子以圖數(shù)據(jù)庫(kù)形式組織并存儲(chǔ)在聚類原子池中。
在本申請(qǐng)的一些實(shí)施例中,可選地,所述聚類屬性包括:對(duì)象、種類、地區(qū)、性別、年齡、期間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于易保網(wǎng)絡(luò)技術(shù)(上海)有限公司,未經(jīng)易保網(wǎng)絡(luò)技術(shù)(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011292917.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 動(dòng)態(tài)存儲(chǔ)管理裝置及方法
- 一種存儲(chǔ)方法、服務(wù)器及存儲(chǔ)控制器
- 一種基于存儲(chǔ)系統(tǒng)的控制方法及裝置
- 一種信息的存儲(chǔ)控制方法
- 一種數(shù)據(jù)存儲(chǔ)方法及裝置
- 數(shù)據(jù)存儲(chǔ)方法、裝置、計(jì)算機(jī)設(shè)備以及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)存儲(chǔ)控制方法及裝置
- 存儲(chǔ)設(shè)備、存儲(chǔ)系統(tǒng)及存儲(chǔ)方法
- 物料存儲(chǔ)方法及系統(tǒng)
- 基于雙芯智能電表的數(shù)據(jù)分類存儲(chǔ)方法和裝置





