[發明專利]一種基于偏好統計的數據表征的模型擬合方法在審
| 申請號: | 201910018055.8 | 申請日: | 2019-01-09 |
| 公開(公告)號: | CN109871867A | 公開(公告)日: | 2019-06-11 |
| 發明(設計)人: | 王菡子;郭翰林;肖國寶;嚴嚴 | 申請(專利權)人: | 廈門大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F17/16 |
| 代理公司: | 廈門南強之路專利事務所(普通合伙) 35200 | 代理人: | 馬應森 |
| 地址: | 361005 *** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 偏好 模型假設 模型擬合 數據表征 殘差 內點 統計 計算機視覺技術 矩陣 核密度估計 分割數據 矩陣分析 模型選取 數據結構 信息內容 統計分析 數據集 自適應 聚類 算法 修剪 保留 | ||
1.一種基于偏好統計的數據表征的模型擬合方法,其特征在于包括以下步驟:
1)準備數據集;
2)針對每個點xi,計算該點到M個模型假設的絕對殘差,用sampson距離度量;
3)J-Linkage的一致統計分析本質是統計所有的殘差值中小于固定閾值的殘差,所述閾值由指定的或者估計的內點噪聲尺度決定;一種非常粗糙的殘差直方圖數據表征,它將所有的小于閾值的殘差歸到一個直方圖簇中和將大于閾值的殘差歸到另一個直方圖簇中;提出將所有的殘差值中小于固定閾值的殘差,歸到K個簇的殘差直方圖中進行殘差數據表征,其中,K是一個相對小的整數>1,即,針對每個數據點xi,對該點關于每個假設的殘差值進行排序,并且安排這些殘差值到直方圖的k個簇中,其中,k∈{1,...,K},因此,定義一個偏好統計矩陣其中θij是關于第i個點和第j個假設對應的直方圖簇的索引值,這是一種更加清晰的數據表征方法,它將比J-Linkage的一致統計分析方法保留了更多的殘差信息;
4)基于非參的核密度估計技術,獲得個有意義的模型假設得到一個修剪的偏好統計矩陣該矩陣只包含個有意義的模型假設
5)分析矩陣中每一行的信息內容,然后將內點從離群點區分出來,其中每一行對應于第i數據點xi,每一行的信息內容和該行的數值情況密切相關,那么,每行的信息熵能夠以簇值的概率分布進行測量,通過以下的熵度量:
其中,r(r<K)是在第i行中所出現的簇值的數目,ait表示第i行中的第t個簇值出現的次數,以及p(ait)是第i行中第t個簇值的概率,p(ait)通過歸一化數值ait在所有簇集中的值,計算如下:
根據公式(1),能夠在每一行獲取不同的信息熵;因此,內點和離群點在偏好統計矩陣中將顯示出很大的區別,通過一個自動熵閾值,能夠移除大量的離群點在不同的值;
6)根據保留下來的內點,分割數據到不同的數據結構里,提出一種基于自適應聚類的模型選取算法,該算法自動學習數據相似矩陣并同時執行聚類來估計模型實例,處理處于交叉模型實例附近的數據點。
2.如權利要求1所述一種基于偏好統計的數據表征的模型擬合方法,其特征在于在步驟1)中,所述準備數據集的具體方法為:輸入N個數據點X={xi}i=1,...,N,從輸入的數據點中采樣M個最小子集生成模型假設H={hj}j=1,...,M,其中一個最小子集是估計一個模型所需要的最小子集,當生成一條直線需要兩個點時,估計一個基礎矩陣需要7個點或者8個點。
3.如權利要求1所述一種基于偏好統計的數據表征的模型擬合方法,其特征在于在步驟3)中,所述K=6。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學,未經廈門大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910018055.8/1.html,轉載請聲明來源鉆瓜專利網。





