[發明專利]基于高斯混合模型聚類算法的分層級數據可視化方法有效
| 申請號: | 202110388631.5 | 申請日: | 2021-04-12 |
| 公開(公告)號: | CN113010615B | 公開(公告)日: | 2021-10-01 |
| 發明(設計)人: | 畢家澤;張平哲;陳祎瓊;高羽佳;劉澳;張瑋 | 申請(專利權)人: | 安徽農業大學 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/215;G06F16/25 |
| 代理公司: | 合肥中谷知識產權代理事務所(普通合伙) 34146 | 代理人: | 洪玲 |
| 地址: | 230000 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 混合 模型 算法 層級 數據 可視化 方法 | ||
本發明涉及一種基于高斯混合模型聚類算法的分層級數據可視化方法,包括以下步驟:在網頁中接收用戶上傳的數據文件儲存至后臺數據庫,并統一文件格式;對統一文件格式后的數據進行分析、清洗預處理,得到待聚類數據;利用高斯混合模型將待聚類數據進行首次聚類和次級聚類,得到待展示數據;建立前端頁面,利用虛擬滾動技術將待展示數據進行分層級可視化展示。本發明利用序號標記基因節點的想法,設計了一種對于關系型基因數據聚類的處理方法,采用分層級顯示數據,并且只加載當前層級數據進行顯示,根據聚類算法將數據劃分成了許多類,這樣大大減少一個頁面顯示的數據量,方便人們觀察。
技術領域
本發明屬于數據可視化領域,具體涉及一種基于高斯混合模型聚類算法的分層級數據可視化方法。
背景技術
在生物信息學中分析、收集遺傳等數據后,大多都需進行數據的可視化。隨著B/S架構的飛速發展以及多數使用者的認可,使得將數據通過前端頁面進行展示的方法也廣泛應用于生物信息方面。在生物信息中基因與基因之間進行節點關系可視化中,多用Echarts的關系圖以及其他開源的可視化庫,引用到前端頁面,實現B/S架構為基礎的數據可視化的過程。
但是該種數據可視化技術還存在以下問題:
1.信息分析后產生的數據量較為龐大,在利用一些開源可視化庫的“力導向圖”模塊或“關系圖”模塊的過程中,會因為數據量過大導致網頁渲染極其緩慢,最后導致瀏覽器崩潰,網頁無響應。具體的在前端頁面中顯示“力導向圖”時,當導入的數據量大于一個閾值時(對于不同的硬件設備運行,閾值也有所不同;此處說明的是市面上普遍的、適中的硬件設備運行),Html頁面需要渲染,由于數據過多導致加載過慢,從而使網頁無響應,最后數據可視化失敗。
2.市面上可使用的開源可視化工具中的“力導向圖”模塊或“關系圖”模塊,展示的效果在一些需要查看節點與節點之間“鏈接線”的長度時并不是很好,再加上大部分的線條會重疊,類似于“毛球”,想要通過人工精準找到兩個節點之間的關系鏈接線條難度極大,給人們在這方面的可觀察性大大降低。另外若針對某一個節點,有很多數據節點鏈接,由于不同數據節點之間的聯系程度(節點距離)不同,再考慮到一些必要的參數的設置,例如節點與節點間斥力參數的設定等,則會在一個正常的顯示頁面中顯示內容不全,如圖6(此處為導入500個數據節點顯示效果)。
3.當需要數據量達到一定程度,并傳給前端進行可視化的時候,大多數工程師會采用“懶加載(懶渲染)”的方法。即每次渲染一部分數據,并監聽窗口的滾動,當某個設定的元素展示后,將加載下一部分數據。這種方式的弊端在于,當用戶滑動窗口次數過多,由于頁面將加載數據而沒有數據釋放,頁面會愈加卡頓,直到某批數據的加入依舊會引起頁面崩潰。
4.虛擬滾動技術在大數據量的數據可視化中也有廣泛的應用。首先,虛擬滾動技術并不適合“力導向圖”或“關系圖”此類數據展示方式;其次,虛擬滾動技術是一次性加載全部數據,然后對可見范圍內的數據進行渲染。但由于大數據分析等方向所傳輸的數據量極大,導致當一次性加載全部數據時也會引起頁面的一些延時問題。
在生物信息的這個方向中,當利用機器學習等計算機算法得出一些數據后,需進行數據展示,從而進行人為的數據利用與篩選。但到目前為止,市面上還沒有一個較好的、可利用的、大數據量的數據可視化方法。
發明內容
本發明的目的就在于為了解決上述問題而提供一種較好的、可利用的、大數據量的一種基于高斯混合模型聚類算法的分層級數據可視化方法。
本發明通過以下技術方案來實現上述目的:
一種基于高斯混合模型聚類算法的分層級數據可視化方法,包括以下步驟:
S1、在網頁中接收用戶上傳的數據文件儲存至后臺數據庫,并統一文件格式;
S2、對統一文件格式后的數據進行分析、清洗預處理,得到待聚類數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽農業大學,未經安徽農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110388631.5/2.html,轉載請聲明來源鉆瓜專利網。





