[發(fā)明專利]一種科研創(chuàng)新平臺(tái)中的數(shù)據(jù)傳輸方法有效
| 申請(qǐng)?zhí)枺?/td> | 202310076677.2 | 申請(qǐng)日: | 2023-02-08 |
| 公開(公告)號(hào): | CN115795112B | 公開(公告)日: | 2023-04-11 |
| 發(fā)明(設(shè)計(jì))人: | 趙春園;方健;宋楊;孫浩然;申建 | 申請(qǐng)(專利權(quán))人: | 吉林交通職業(yè)技術(shù)學(xué)院 |
| 主分類號(hào): | G06F16/901 | 分類號(hào): | G06F16/901;G06F16/903 |
| 代理公司: | 鄭州知倍通知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 41191 | 代理人: | 邱珍珍 |
| 地址: | 130012 *** | 國(guó)省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 科研 創(chuàng)新 平臺(tái) 中的 數(shù)據(jù)傳輸 方法 | ||
本發(fā)明涉及數(shù)據(jù)傳輸技術(shù)領(lǐng)域,具體涉及一種科研創(chuàng)新平臺(tái)中的數(shù)據(jù)傳輸方法,該方法采集待傳輸?shù)脑紨?shù)據(jù),將原始數(shù)據(jù)根據(jù)詞條存入至少兩個(gè)數(shù)據(jù)庫(kù)中;統(tǒng)計(jì)每個(gè)重復(fù)詞條所在的數(shù)據(jù)庫(kù)數(shù)量,根據(jù)每個(gè)重復(fù)詞條所在的數(shù)據(jù)庫(kù)數(shù)量計(jì)算對(duì)應(yīng)重復(fù)詞條在所有數(shù)據(jù)庫(kù)中的全局關(guān)聯(lián)指標(biāo);根據(jù)重復(fù)詞條的數(shù)量和對(duì)應(yīng)擴(kuò)展詞條的數(shù)量獲取重復(fù)詞條在數(shù)據(jù)庫(kù)中的局部關(guān)聯(lián)指標(biāo);對(duì)于任意一個(gè)重復(fù)詞條,結(jié)合重復(fù)詞條的全局關(guān)聯(lián)指標(biāo)以及重復(fù)詞條分別在每個(gè)數(shù)據(jù)庫(kù)中的局部關(guān)聯(lián)指標(biāo)得到重復(fù)詞條的關(guān)聯(lián)系數(shù),令非重復(fù)詞條的關(guān)聯(lián)系數(shù)為預(yù)設(shè)值;根據(jù)關(guān)聯(lián)系數(shù)完成數(shù)據(jù)傳輸。本發(fā)明減少了數(shù)據(jù)傳輸過(guò)程中有效數(shù)據(jù)的缺失。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)傳輸技術(shù)領(lǐng)域,具體涉及一種科研創(chuàng)新平臺(tái)中的數(shù)據(jù)傳輸方法。
背景技術(shù)
基于大數(shù)據(jù)的科研創(chuàng)新平臺(tái)通過(guò)多種途徑采集數(shù)據(jù),但對(duì)采集到的原始數(shù)據(jù)并不進(jìn)行篩選,導(dǎo)致需要較長(zhǎng)的時(shí)間進(jìn)行數(shù)據(jù)收集。而數(shù)據(jù)收集是一個(gè)經(jīng)驗(yàn)積累的過(guò)程,收集到的數(shù)據(jù)中大部分并不是重要的,甚至可以是完全沒有意義的,這些數(shù)據(jù)消耗了大量的系統(tǒng)資源,并且在后續(xù)的數(shù)據(jù)分析與數(shù)據(jù)挖掘中也是冗余數(shù)據(jù),對(duì)科研是無(wú)意義的。原始數(shù)據(jù)傳輸?shù)交ヂ?lián)網(wǎng)云端對(duì)帶寬和空間要求很大,如果不對(duì)原始數(shù)據(jù)做約束,很容易造成存儲(chǔ)容量增長(zhǎng)過(guò)大,存儲(chǔ)空間不足的問(wèn)題,使得存儲(chǔ)成本增加。
目前對(duì)于原始數(shù)據(jù)進(jìn)行約束,通常通過(guò)統(tǒng)計(jì)原始數(shù)據(jù)中每種數(shù)據(jù)詞條的出現(xiàn)次數(shù),將出現(xiàn)次數(shù)少的數(shù)據(jù)作為無(wú)效數(shù)據(jù)進(jìn)行刪除,將保留的數(shù)據(jù)作為有效數(shù)據(jù)進(jìn)行數(shù)據(jù)傳輸,但是數(shù)據(jù)存在關(guān)聯(lián),而該方法沒有考慮數(shù)據(jù)之間的關(guān)聯(lián)性,僅根據(jù)出現(xiàn)次數(shù)的多少來(lái)確認(rèn)數(shù)據(jù)的有效和無(wú)效,會(huì)導(dǎo)致數(shù)據(jù)傳輸過(guò)程中有效數(shù)據(jù)的缺失。
發(fā)明內(nèi)容
為了解決上述現(xiàn)有對(duì)于原始數(shù)據(jù)的約束不準(zhǔn)確,導(dǎo)致數(shù)據(jù)傳輸過(guò)程中有效數(shù)據(jù)的缺失問(wèn)題,本發(fā)明的目的在于提供一種科研創(chuàng)新平臺(tái)中的數(shù)據(jù)傳輸方法,所采用的技術(shù)方案具體如下:本發(fā)明一個(gè)實(shí)施例提供了一種科研創(chuàng)新平臺(tái)中的數(shù)據(jù)傳輸方法,該方法包括:
采集待傳輸?shù)脑紨?shù)據(jù),將原始數(shù)據(jù)根據(jù)詞條存入至少兩個(gè)數(shù)據(jù)庫(kù)中,每個(gè)數(shù)據(jù)庫(kù)至少有兩個(gè)詞條;
統(tǒng)計(jì)每個(gè)重復(fù)詞條所在的數(shù)據(jù)庫(kù)數(shù)量,重復(fù)詞條是指在所有詞條中至少重復(fù)出現(xiàn)兩次的詞條;根據(jù)每個(gè)重復(fù)詞條所在的數(shù)據(jù)庫(kù)數(shù)量計(jì)算對(duì)應(yīng)重復(fù)詞條在所有數(shù)據(jù)庫(kù)中的全局關(guān)聯(lián)指標(biāo);
對(duì)于任意一個(gè)數(shù)據(jù)庫(kù)中的任意一個(gè)重復(fù)詞條,在數(shù)據(jù)庫(kù)中獲取重復(fù)詞條的擴(kuò)展詞條,擴(kuò)展詞條是指對(duì)重復(fù)詞條進(jìn)行擴(kuò)展得到的詞條,根據(jù)重復(fù)詞條的數(shù)量和對(duì)應(yīng)擴(kuò)展詞條的數(shù)量獲取重復(fù)詞條在數(shù)據(jù)庫(kù)中的局部關(guān)聯(lián)指標(biāo);
對(duì)于任意一個(gè)重復(fù)詞條,結(jié)合重復(fù)詞條的所述全局關(guān)聯(lián)指標(biāo)以及重復(fù)詞條分別在每個(gè)數(shù)據(jù)庫(kù)中的所述局部關(guān)聯(lián)指標(biāo)得到重復(fù)詞條的關(guān)聯(lián)系數(shù);根據(jù)關(guān)聯(lián)系數(shù)完成數(shù)據(jù)傳輸。
進(jìn)一步的,所述全局關(guān)聯(lián)指標(biāo)的獲取方法,包括:
以重復(fù)詞條所在的數(shù)據(jù)庫(kù)數(shù)量為分子,數(shù)據(jù)庫(kù)的總數(shù)量為分母得到對(duì)應(yīng)的比值,將以自然常數(shù)為底數(shù),比值為指數(shù)得到的結(jié)果作為對(duì)應(yīng)重復(fù)詞條的所述全局關(guān)聯(lián)指標(biāo)。
進(jìn)一步的,所述局部關(guān)聯(lián)指標(biāo)的獲取方法,包括:
對(duì)于重復(fù)詞條的擴(kuò)展詞條,統(tǒng)計(jì)每個(gè)擴(kuò)展詞條的數(shù)量作為第一數(shù)量,獲取每個(gè)擴(kuò)展詞條的權(quán)重值,獲取每個(gè)擴(kuò)展詞條的第一數(shù)量與對(duì)應(yīng)權(quán)重值的乘積,得到乘積之和;統(tǒng)計(jì)重復(fù)詞條在數(shù)據(jù)庫(kù)中的數(shù)量作為第二數(shù)量,以乘積之和與第二數(shù)量的相加結(jié)果為分子,數(shù)據(jù)庫(kù)內(nèi)的詞條總數(shù)量為分母得到的比值作為重復(fù)詞條在數(shù)據(jù)庫(kù)中的局部關(guān)聯(lián)指標(biāo)。
進(jìn)一步的,所述權(quán)重值的獲取方法,包括:
對(duì)于任意一個(gè)擴(kuò)展詞條,統(tǒng)計(jì)擴(kuò)展詞條所包含的每個(gè)重復(fù)詞條的數(shù)量作為第三數(shù)量,分別將每個(gè)第三數(shù)量與常數(shù)1的相加結(jié)果作為以常數(shù)2為底數(shù)的對(duì)數(shù)函數(shù)的真數(shù),得到的結(jié)果作為第一值,將第一值的均值作為對(duì)應(yīng)擴(kuò)展詞條的權(quán)重值。
進(jìn)一步的,所述關(guān)聯(lián)系數(shù)的獲取方法,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吉林交通職業(yè)技術(shù)學(xué)院,未經(jīng)吉林交通職業(yè)技術(shù)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310076677.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。





