[發(fā)明專利]通用力場(chǎng)數(shù)據(jù)庫(kù)及其更新方法和檢索方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810420916.0 | 申請(qǐng)日: | 2018-05-04 |
| 公開(公告)號(hào): | CN108804863A | 公開(公告)日: | 2018-11-13 |
| 發(fā)明(設(shè)計(jì))人: | 楊明俊;師雪坤;曹風(fēng)雷;孫廣旭;劉陽(yáng);張佩宇;馬健;賴力鵬;溫書豪 | 申請(qǐng)(專利權(quán))人: | 深圳晶泰科技有限公司 |
| 主分類號(hào): | G06F19/00 | 分類號(hào): | G06F19/00 |
| 代理公司: | 深圳市科吉華烽知識(shí)產(chǎn)權(quán)事務(wù)所(普通合伙) 44248 | 代理人: | 胡玉 |
| 地址: | 518000 廣東省深圳市龍華區(qū)*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 檢索 控制層 數(shù)據(jù)庫(kù) 力場(chǎng) 數(shù)據(jù)更新 數(shù)據(jù)清洗 視圖層 數(shù)據(jù)源 通用 更新 數(shù)據(jù)采集模塊 數(shù)據(jù)檢索模塊 數(shù)據(jù)校驗(yàn)?zāi)K 準(zhǔn)確度 分子力場(chǎng) 復(fù)雜數(shù)據(jù) 獲取目標(biāo) 檢索方式 簡(jiǎn)單數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù)存儲(chǔ) 數(shù)據(jù)檢索 數(shù)據(jù)校驗(yàn) 通信連接 性能平衡 模型層 元數(shù)據(jù) 封裝 架構(gòu) 平衡 | ||
本發(fā)明屬于分子力場(chǎng)技術(shù)領(lǐng)域,具體為通用力場(chǎng)數(shù)據(jù)庫(kù)及其更新方法和檢索方法,包括模型層、視圖層、控制層;控制層包括數(shù)據(jù)采集模塊、數(shù)據(jù)清洗模塊、數(shù)據(jù)校驗(yàn)?zāi)K和數(shù)據(jù)檢索模塊;視圖層用Python封裝的SDK實(shí)現(xiàn);控制層和視圖之間通信連接。該通用力場(chǎng)數(shù)據(jù)庫(kù)的更新方法,包括定期從公開的數(shù)據(jù)源獲取最新的元數(shù)據(jù),根據(jù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)更新從公開的數(shù)據(jù)源獲取目標(biāo)數(shù)據(jù);還包括數(shù)據(jù)清洗、數(shù)據(jù)校驗(yàn)。檢索方法包括簡(jiǎn)單數(shù)據(jù)檢索和復(fù)雜數(shù)據(jù)檢索。本發(fā)明平衡了數(shù)據(jù)更新和數(shù)據(jù)檢索之間的性能平衡,全面豐富的數(shù)據(jù),海量的數(shù)據(jù)存儲(chǔ)架構(gòu),數(shù)據(jù)庫(kù)準(zhǔn)確度高很多,檢索速度快,檢索方式簡(jiǎn)潔。
技術(shù)領(lǐng)域
本發(fā)明屬于分子力場(chǎng)技術(shù)領(lǐng)域,具體為通用力場(chǎng)數(shù)據(jù)庫(kù)及其更新方法和檢索方法。
背景技術(shù)
力場(chǎng)技術(shù)是分子和晶體模擬中用來精確計(jì)算結(jié)構(gòu)和能量的計(jì)算技術(shù)。在力場(chǎng)的開發(fā)、優(yōu)化和具體使用中需要大量的數(shù)據(jù),包括分子數(shù)據(jù)、分子片段數(shù)據(jù)、力場(chǎng)參數(shù)和原子類型相關(guān)數(shù)據(jù)、力場(chǎng)計(jì)算數(shù)據(jù)、量化計(jì)算的數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù)、分子動(dòng)力學(xué)模擬數(shù)據(jù)等。目前還沒有集上述數(shù)據(jù)于一體的統(tǒng)一數(shù)據(jù)庫(kù),只有獨(dú)立的分子數(shù)據(jù)庫(kù)和實(shí)驗(yàn)數(shù)據(jù)庫(kù)可供用戶選擇。最大的公開分子數(shù)據(jù)庫(kù)是PubChem。
在科學(xué)模擬計(jì)算中通常會(huì)用量化計(jì)算數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)作為訓(xùn)練、擬合、驗(yàn)證的標(biāo)準(zhǔn)數(shù)據(jù)。由于沒有集上述數(shù)據(jù)于一體的統(tǒng)一數(shù)據(jù)庫(kù),所以為物理、化學(xué)和生物中的模擬計(jì)算相關(guān)的科學(xué)研究和生產(chǎn)研發(fā)帶來了很多困擾。當(dāng)前大家的普遍做法是從獨(dú)立的分子數(shù)據(jù)庫(kù)采集合適的分子,然后用這些分子去匹配另外的實(shí)驗(yàn)數(shù)據(jù)庫(kù),接著自己做量化計(jì)算采集量化數(shù)據(jù),最后將這些數(shù)據(jù)匯總到一起使用。在這個(gè)環(huán)節(jié)中弊端如下:
需要從不同的地方采集數(shù)據(jù),容易出錯(cuò),而且數(shù)據(jù)量大,時(shí)間長(zhǎng),效率低;
各個(gè)地方采集來的數(shù)據(jù)格式都不同,如果要一起使用,需要做大量的數(shù)據(jù)清洗和整理工作,時(shí)間和人工成本非常高;
力場(chǎng)計(jì)算數(shù)據(jù)、量化計(jì)算數(shù)據(jù)、分子動(dòng)力學(xué)模擬數(shù)據(jù)市場(chǎng)上都沒有數(shù)據(jù)庫(kù),用戶自己計(jì)算成本非常高;
單獨(dú)的數(shù)據(jù)庫(kù)沒有辦法對(duì)數(shù)據(jù)做交叉驗(yàn)證,所以很難保障數(shù)據(jù)的準(zhǔn)確性,從人工數(shù)據(jù)錄入到系統(tǒng)數(shù)據(jù)持久化都可能出現(xiàn)錯(cuò)誤,導(dǎo)致數(shù)據(jù)不準(zhǔn)。
發(fā)明內(nèi)容
針對(duì)上述技術(shù)問題,本發(fā)明提供一種效率高、成本低的通用力場(chǎng)數(shù)據(jù)庫(kù),及其更新方法和檢索方法,具體技術(shù)方案為:
通用力場(chǎng)數(shù)據(jù)庫(kù),包括模型層、視圖層、控制層的3層MVC架構(gòu);
所述的模型層,數(shù)據(jù)存儲(chǔ)采用SQL+文件數(shù)據(jù)庫(kù)的混合架構(gòu),核心數(shù)據(jù)包括SQL中的8張表,分別是分子表,分子片段表、力場(chǎng)參數(shù)表、原子類型表、力場(chǎng)計(jì)算數(shù)據(jù)表、量化計(jì)算數(shù)據(jù)表、實(shí)驗(yàn)數(shù)據(jù)表、分子動(dòng)力學(xué)模擬數(shù)據(jù)表;力場(chǎng)計(jì)算、量化計(jì)算、分子動(dòng)力學(xué)模擬的計(jì)算日志都是以文件的形式存儲(chǔ)在文件數(shù)據(jù)庫(kù)中的;
控制層包括4個(gè)核心模塊,分別為數(shù)據(jù)采集模塊、數(shù)據(jù)清洗模塊、數(shù)據(jù)校驗(yàn)?zāi)K和數(shù)據(jù)檢索模塊;所述的數(shù)據(jù)采集模塊對(duì)模型層有讀寫的權(quán)限;數(shù)據(jù)校驗(yàn)?zāi)K、數(shù)據(jù)檢索模塊對(duì)模型層只有讀的權(quán)限;數(shù)據(jù)清洗模塊只被數(shù)據(jù)采集模塊調(diào)用,對(duì)模型層沒有讀寫權(quán)限;
所述的視圖層用Python封裝的SDK實(shí)現(xiàn);
控制層和視圖之間通信連接。
進(jìn)一步的,該通用力場(chǎng)數(shù)據(jù)庫(kù)的更新方法,所述的數(shù)據(jù)庫(kù)的更新包括兩種方式:定期從公開的數(shù)據(jù)源獲取最新的元數(shù)據(jù),根據(jù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)更新從公開的數(shù)據(jù)源獲取目標(biāo)數(shù)據(jù);
所述的定期從公開的數(shù)據(jù)源獲取最新的元數(shù)據(jù),包括以下過程:
(1)用戶通過SDK向數(shù)據(jù)采集模塊發(fā)送需要獲取數(shù)據(jù)的數(shù)據(jù)源地址,更新頻率,以及數(shù)據(jù)源中的數(shù)據(jù)與標(biāo)準(zhǔn)數(shù)據(jù)的對(duì)應(yīng)關(guān)系;
(2)數(shù)據(jù)采集模塊內(nèi)部持續(xù)運(yùn)行的定時(shí)器,根據(jù)用戶設(shè)定的更新頻率,定時(shí)器觸發(fā)更新,數(shù)據(jù)采集模塊主動(dòng)向數(shù)據(jù)源發(fā)送請(qǐng)求獲取數(shù)據(jù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳晶泰科技有限公司,未經(jīng)深圳晶泰科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810420916.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 數(shù)據(jù)庫(kù)
- 數(shù)據(jù)庫(kù)管理系統(tǒng)及數(shù)據(jù)庫(kù)
- 數(shù)據(jù)庫(kù)構(gòu)筑裝置、數(shù)據(jù)庫(kù)檢索裝置、數(shù)據(jù)庫(kù)裝置、數(shù)據(jù)庫(kù)構(gòu)筑方法、以及數(shù)據(jù)庫(kù)檢索方法
- 數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)處理方法
- 數(shù)據(jù)庫(kù)系統(tǒng)、數(shù)據(jù)庫(kù)更新方法、數(shù)據(jù)庫(kù)以及數(shù)據(jù)庫(kù)更新程序
- 容器數(shù)據(jù)庫(kù)
- 數(shù)據(jù)庫(kù)同步方法及數(shù)據(jù)庫(kù)
- 一種MongoDB數(shù)據(jù)庫(kù)對(duì)象復(fù)制延遲監(jiān)控方法和裝置
- 數(shù)據(jù)分布式存儲(chǔ)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 數(shù)據(jù)庫(kù)語(yǔ)句執(zhí)行方法及裝置
- 自然重力場(chǎng)干涉方法
- 全球四維信息傳遞裝置和系統(tǒng)
- 多尺度壓力場(chǎng)的建立方法
- 一種小水電出力場(chǎng)景削減的方法
- 鈦合金銑削-拋光-噴丸強(qiáng)化殘余應(yīng)力場(chǎng)工藝控制方法
- 確定頁(yè)巖氣藏水平井重復(fù)壓裂前現(xiàn)地應(yīng)力場(chǎng)的方法及設(shè)備
- 一種基于Delaunay三角網(wǎng)的重力場(chǎng)三維模型構(gòu)建方法
- 基于重力場(chǎng)三維特征的重力輔助慣性導(dǎo)航適配區(qū)選取方法
- 分子力場(chǎng)擬合方法
- 一種基于雙向積分的衛(wèi)星重力場(chǎng)反演方法和系統(tǒng)





