[發明專利]一種手寫體數字圖像聚類方法、系統及設備在審
| 申請號: | 201711365229.5 | 申請日: | 2017-12-18 |
| 公開(公告)號: | CN108108687A | 公開(公告)日: | 2018-06-01 |
| 發明(設計)人: | 羅曉慧;張莉;李凡長;王邦軍;張召;凌興宏;姚望舒 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 215104 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本數據 手寫體數字 系統及設備 相似性矩陣 聚類類別 聚類算法 圖像聚類 低維 錨點 嵌入 標簽 圖像 集成學習算法 分類準確率 分類結果 聚類中心 特征分解 有效地 聚類 申請 | ||
本申請公開了一種手寫體數字圖像聚類方法、系統及設備,該方法包括:獲取手寫體數字圖像對應的樣本數據集;利用聚類算法從所述樣本數據集中確定出m個聚類中心作為錨點;利用所述錨點確定所述樣本數據集中不同樣本數據之間的相似性矩陣;對所述相似性矩陣進行特征分解,以得到低維嵌入;利用聚類算法對所述低維嵌入進行聚類,以得到每個樣本數據對應的聚類類別標簽;結合所述聚類類別標簽以及集成學習算法,確定出每個樣本數據的最終分類結果。本申請有效地提升了手寫體數字圖像的分類準確率。
技術領域
本發明涉及分類技術領域,特別涉及一種手寫體數字圖像聚類方法、系統及設備。
背景技術
當前,在一些特定的場合下需要對人們的手寫體數字進行識別分類。常規的做法是通過人工識別分類的方式來對手寫體數字進行分類,以確定出手寫體數字的書寫者。然而,由于這種人工分類方式的效率較低,需要花費較多的時間,因此人們開始借助計算機程序算法來對手寫體數字進行分類,主要是先采集手寫體數字的圖像,然后利用程序算法對手寫體數字圖像進行分類,這樣有利于提升分類速度。
然而,現有用于對手寫體數字圖像進行分類的算法的分類準確率還比較低,有待進一步的提升。
發明內容
有鑒于此,本發明的目的在于提供一種手寫體數字圖像聚類方法、系統及設備,能夠有效提升手寫體數字圖像的分類準確率。其具體方案如下:
第一方面,本發明公開了一種手寫體數字圖像聚類方法,包括:
獲取手寫體數字圖像對應的樣本數據集;
利用聚類算法從所述樣本數據集中確定出m個聚類中心作為錨點,得到m個錨點;其中,m為正整數;
利用所述錨點確定所述樣本數據集中不同樣本數據之間的相似性矩陣;
對所述相似性矩陣進行特征分解,以得到低維嵌入;
利用聚類算法對所述低維嵌入進行聚類,以得到每個樣本數據對應的聚類類別標簽;
結合所述聚類類別標簽以及集成學習算法,確定出每個樣本數據的最終分類結果。
可選的,所述利用聚類算法從所述樣本數據集中確定出m個聚類中心作為錨點的步驟,包括:
利用k-means算法從所述樣本數據集中確定出m個聚類中心作為錨點。
可選的,所述利用所述錨點確定所述樣本數據集中不同樣本數據之間的相似性矩陣的步驟,包括:
計算樣本數據與錨點之間的歐氏距離;
利用樣本數據與錨點之間的歐氏距離,確定樣本數據與錨點之間的相似性矩陣;
利用樣本數據與錨點之間的相似性矩陣,確定所述樣本數據集中不同樣本數據之間的相似性矩陣。
可選的,所述利用聚類算法對所述低維嵌入進行聚類的步驟,包括:
利用k-means算法對所述低維嵌入進行聚類。
可選的,所述結合所述聚類類別標簽以及集成學習算法,確定出每個樣本數據的最終分類結果的步驟之前,還包括:
對所述聚類類別標簽進行修正。
可選的,所述對所述聚類類別標簽進行修正的步驟,包括:
利用bestMap算法對所述聚類類別標簽進行修正。
第二方面,本發明公開了一種手寫體數字圖像聚類系統,包括:
數據獲取模塊,用于獲取手寫體數字圖像對應的樣本數據集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711365229.5/2.html,轉載請聲明來源鉆瓜專利網。





