[發明專利]一種數據整合分類方法有效
| 申請號: | 201710810480.1 | 申請日: | 2017-09-11 |
| 公開(公告)號: | CN107609097B | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 李德嶺;張力偉;季楠;王韜;何建強;曹國雄;陶然;肖雄 | 申請(專利權)人: | 首都醫科大學附屬北京天壇醫院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62 |
| 代理公司: | 北京中創陽光知識產權代理有限責任公司 11003 | 代理人: | 張宇鋒 |
| 地址: | 100050*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 整合 分類 方法 | ||
一種數據整合分類方法,分類層級不少于二級,包括步驟1與步驟2。步驟1為:將所收集到的數據與低層級分類標準進行匹配,如匹配成功,則直接將數據分類至匹配的低層級分類標準中;如匹配不成功,則進入步驟2。步驟2為:將數據與高層級分類標準進行匹配,如匹配成功,則直接將數據分類至匹配的高層級分類標準中;如匹配不成功,則數據分類失敗。本發明提供的數據整合分類方法分類精度較高。
技術領域
本發明涉及數據處理技術領域,特別是一種數據整合分類方法。
背景技術
數據分類就是把具有某種共同屬性或特征的數據歸并在一起,通過其類別的屬性或特征來對數據進行區別。為了實現數據共享和提高處理效率,必須遵循約定的分類原則和方法,按照信息的內涵、性質及管理的要求,將系統內所有信息按一定的結構體系分為不同的集合,從而使得每個信息在相應的分類體系中都有一個對應位置。
數據分類是目前數據處理的一大難題,特別是數據來源較多的情況下,由于數據錄入方對于錄入規則的掌握及理解各不相同,造成所收集到的數據格式各異,為了提升數據分類精度,很多時候無法通過計算機對其進行數據處理,而必須采用人工閱讀的方式,造成了大量的人力成本浪費的同時,極大地降低了工作效率。
基于此,現有技術出現了一種關鍵詞檢索分類方式,即通過對所錄入數據中文字信息進行關鍵詞檢索,從而將該條數據劃分至相應分類的方法。這種方法在一定程度上提升了計算機分類的處理精度,但是精度仍舊較低,特別是對于一些較為通用的關鍵詞,或是多個關鍵詞羅列所造成的不同分類結果,使用此方法無法高精度地對數據進行分類。
發明內容
本發明所要解決的技術問題在于現有技術中的數據分類方法分類精度較低,而提供了一種使用計算機自動進行分類,且分類結果精度較高的數據分類方法。
為解決上述技術問題,本發明采用的技術方案如下:
一種數據整合分類方法,所述分類層級不少于二級,包括以下步驟:
步驟1:將所收集到的數據與低層級分類標準進行匹配,如匹配成功,則直接將所述數據分類至匹配的所述低層級分類標準中;如匹配不成功,則進入步驟2;
步驟2:將所述數據與高層級分類標準進行匹配,如匹配成功,則直接將所述數據分類至匹配的所述高層級分類標準中;如匹配不成功,則所述數據分類失敗。
上述方法中,所述分類層級為三級,一級分類為最高級分類標準,三級分類為最低級分類標準,所述步驟1包括步驟11與步驟12;
所述步驟11為:將所述數據與所述三級分類標準進行匹配,如匹配成功,則直接將所述數據分類至匹配的所述三級分類標準中;如匹配不成功,則進入所述步驟12;
所述步驟12為:將所述數據與所述二級分類標準進行匹配,如匹配成功,則直接將所述數據分類至匹配的所述二級分類標準中;如匹配不成功,則進入步驟2;
所述步驟2為:將所述數據與所述一級分類標準進行匹配,如匹配成功,則直接將所述數據分類至匹配的所述一級分類標準中;如匹配不成功,則所述數據分類失敗。
上述方法中,在所述步驟1之前,還包括制定所述分類層級的步驟0,所述步驟0為:制定所述三級分類的名稱、關鍵詞及標準編碼,制定所述二級分類的名稱及關鍵詞,制定所述一級分類的名稱。
上述方法中,所述步驟11中的匹配方式為:首先對所述數據的文字信息與所述三級分類的名稱進行匹配,如無法匹配則對所述數據的文字信息與所述三級分類的標準編碼進行匹配,如仍無法匹配則對所述數據的文字信息與所述三級分類的關鍵詞進行匹配,如匹配仍不成功,則進入步驟12;
所述步驟12中的匹配方式為:首先對所述數據的文字信息與所述二級分類的名稱進行匹配,如無法匹配則對所述數據的文字信息與所述二級分類的關鍵詞進行匹配,如仍無法匹配則進入步驟2;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于首都醫科大學附屬北京天壇醫院,未經首都醫科大學附屬北京天壇醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710810480.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能律師專家應答方法
- 下一篇:搜索方法及裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





