[發明專利]一種折線對比分析相似度的方法有效
| 申請號: | 201310420053.4 | 申請日: | 2013-09-13 |
| 公開(公告)號: | CN103473458B | 公開(公告)日: | 2017-02-08 |
| 發明(設計)人: | 王錦龍;范淵;楊永清 | 申請(專利權)人: | 杭州安恒信息技術有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 310051 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 折線 對比 分析 相似 方法 | ||
?
技術領域
本發明涉及一種計算機軟件,尤其是涉及一種計算機軟件中關于兩條折線的相似程度的對比方法。
?
背景技術
一些對數據的挖掘、分析的過程中,需要將一些離散的數據構成的平面坐標點進行分析,從而得出這些平面坐標點之間的相互關系。若存在先后關系的兩組數據構成的平面坐標點構成兩條有先后關系的兩條折線,若要通過計算機分析這兩條折線的相似度,也是破解這兩組數據的關聯度的重要且有效的步驟。??但是現有的軟件中,對兩條折線的相似度的判斷非常粗略,其可靠性不高。
發明內容
本發明主要是解決現有技術所存在的判斷兩條折線的相似度非常粗略,可靠性不高的技術問題,提供一種能夠數據化,且精確、可靠的判斷兩條折線的精確度的折線對比分析相似度的方法。
1.??本發明的上述技術問題主要是通過下述技術方案得以解決的:一種折線對比分析相似度的方法,它包括初始A坐標存儲模塊、初始B坐標存儲模塊、合并坐標模塊、計算模塊,其特征在于,它包括如下步驟:
1、????在初始A坐標存儲模塊儲存有折線LineA坐標,在初始B坐標存儲模塊儲存有折線LineB的坐標,AXmin、?BXmin分別為LineA的X軸區間與LineB的X軸區間的最小值,AXmax、BXma?x分別為LineA的X軸區間與LineB的X軸區間的最大值,將LineA的X軸區間與LineB的X軸區間均輸入合并坐標模塊,獲得X軸合并區間[Xmin,Xmax],其中Xmin為AXmin,?BXmin中的最小值,其中Xmax為AXmax,BXmax中的最大值;
2、????將LineA在合并區間上沒有采樣點的時間段上,為LineA生成新的采樣點,將LineB在合并區間上沒有采樣點的時間段(X軸單位)上,為LineB生成新的采樣點;
3、????在計算模塊內設有兩個區位用于保存偏離度,分別為直接偏離累計值區位AmpAcc、方差偏離累計值區位SqrAcc、并將AmpAcc和SqrAcc初始化為0,計算模塊內還設有兩個區位用于保存偏離基數,分別為直接偏離累計值基準區位AmpAccBase、方差偏離累計值基準區位SqrAccBase,將AmpAccBase和SqrAccBase也初始化為0;
4、????對合并區間[Xmin,Xmax]設于分段長度SegLen,SegLen的長度為1個X軸時間段的倍數,?將LineA,LineB的所有采樣點,按照SegLen進行匯總分段,若N為自然數,則第N個分段SegN對應X軸合并缺件的X軸時間段為[N,?N+SegLen]區間,包含從時間段編號1到N+SegLen的所有時間段,SegN的Y軸取值為相應時間段的采樣點的Y軸取值的累加和,最終得到兩條新的匯總折線LineSA,LineSB;
5、????按照分段,從第一個分段Seg1到最后一個分段,進行遍歷:
(1)對于當前分段SegC,將LineSA與LineSB在當前分段的Y軸取值進行相減然后取絕對值獲得直接偏離AmpC,對AmpC進行乘方獲得方差偏離AmpS;
(2)將AmpC加到AmpAcc上,實現AmpAcc對于所有分段的直接偏離的累計;
(3)將AmpS加到SqrAcc上,實現AmpSqr對于所有分段的方差偏離的累計;
(4)將LineSA的當前取值的絕對值累加到AmpAccBase上,將LineSA的當前取值的絕對值的乘方累加到SqrAccBase上,獲得兩個偏離指標基準;
遍歷結束后得到的AmpAcc代表了所有分段的直接偏離量的累計,而SqrAcc代表了所有分段的偏離乘方的累計;
6、????獲得兩個偏離度指標:
直接偏離百分比(AmpPer):AmpPer?=?AmpAcc?/?AmpAccBase?*?100%;
方差偏離百分比(SqrPer):SqrPer?=?SqrAcc?/?SqrAccBase?*?100%;
7、????獲得兩個耦合度指標:
直接耦合百分比(AmpFitPer):AmpFitPer?=?100%?-?AmpPer;
方差耦合百分比(SqrFitPer):SqrFitPer?=?100%?-?SqrPer。
本發明是一種對折線中每個采樣點的X軸、Y軸的取值,結合設定的X軸的允許分布偏離窗口,得到量化的耦合度、偏離度指標,進而可為指定的折線,從指定的折線集合中,尋找到匹配耦合度最高、偏離度最小的折線,從而得到最佳匹配折線對的數據分析系統。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州安恒信息技術有限公司,未經杭州安恒信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310420053.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





