[發明專利]一種文件分類方法及裝置有效
| 申請號: | 201710138149.X | 申請日: | 2017-03-09 |
| 公開(公告)號: | CN106897454B | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 趙毅強 | 申請(專利權)人: | 北京時間股份有限公司 |
| 主分類號: | G06F16/16 | 分類號: | G06F16/16;G06F16/583;G06F16/55;G06F16/35;G06K9/62 |
| 代理公司: | 北京市浩天知識產權代理事務所(普通合伙) 11276 | 代理人: | 宋菲;劉蘭蘭 |
| 地址: | 100089 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文件 分類 方法 裝置 | ||
本發明公開了一種文件分類方法及裝置,涉及文件分類技術領域,該方法包括:獲取文件中包含的圖片信息;通過預設的圖片分類模型確定與圖片信息相對應的圖片分類結果;根據圖片分類結果生成與文件相對應的文件特征向量;通過預設的文件分類模型確定與文件特征向量相對應的文件分類結果。由此可見,本發明解決了現有技術中無法根據圖片內容對新聞分類的問題,取得了能夠綜合新聞中包含的文本和圖片內容進行更加準確和更加精確的分類的有益效果。
技術領域
本發明涉及文件分類技術領域,具體涉及一種文件分類方法及裝置。
背景技術
新聞,是對通過報紙、電臺、廣播、電視臺、互聯網等媒體途徑所傳播的信息的一種稱謂,主要為對新近發生事實的報道或者新近事實變動的報道,因此,新聞的及時性顯得尤為重要。在日常生活中,為了便于讀者能快速找到自己所關心的新聞,需要對新聞進行分類。目前的分類一般為簡單的文本篩選,或者再加入關鍵信息篩選,例如新聞出處、語言語種等關鍵信息,然后根據上述信息對新聞進行分類。上述分類方式還可以廣泛應用于除新聞之外的各類文件中。
但是,發明人在實現本發明的過程中,發現在現有技術中至少存在如下問題:現有技術僅能根據新聞等文件中的文本內容進行分類。而隨著社會的發展,新聞中的圖片內容越來越多,而且在微博、微信等自媒體平臺上,很多新聞是直接以圖片形式(例如將整篇文字新聞轉換成圖片形式添加在微博或微信朋友圈附圖中)展示,或者在新聞中加入了二維碼等,而現有的新聞分類技術無法識別圖片,無法根據圖片內容進行新聞分類,降低了新聞分類的準確性。由此可見,現有的文件分類方式存在著分類依據單一、適用范圍狹窄等諸多缺陷。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的文件分類方法和相應的裝置。
根據本發明的一個方面,提供了一種文件分類方法,該方法包括:獲取文件中包含的圖片信息;通過預設的圖片分類模型確定與圖片信息相對應的圖片分類結果;根據圖片分類結果生成與文件相對應的文件特征向量;通過預設的文件分類模型確定與文件特征向量相對應的文件分類結果。
根據本發明的另一方面,提供了一種文件分類裝置,該裝置包括:獲取模塊,用于獲取文件中包含的圖片信息;圖片分類模塊,用于通過預設的圖片分類模型確定與圖片信息相對應的圖片分類結果;特征向量模塊,用于根據圖片分類結果生成與文件相對應的文件特征向量;文件分類模塊,用于通過預設的文件分類模型確定與文件特征向量相對應的文件分類結果。
根據本發明提供的文件分類方法及裝置,能夠通過預設的圖片分類模型確定與文件中包含的圖片信息相對應的圖片分類結果,并根據該圖片分類結果對文件進行分類,由此解決了現有的文件分類方式僅能根據單一的文本特征進行分類所導致的分類結果不準確的問題,進而提升了分類結果的準確度,拓寬了本方案的適用范圍。
上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明的具體實施方式。
附圖說明
通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本發明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1示出了本發明實施例一提供的一種文件分類方法的流程圖;
圖2示出了本發明實施例二提供的一種文件分類方法的流程圖;
圖3示出了本發明實施例三提供的一種文件分類裝置的結構示意圖;
圖4示出了本發明實施例四提供的一種文件分類裝置的結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京時間股份有限公司,未經北京時間股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710138149.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:工程BIM進度模型與現場監控對比方法
- 下一篇:一種可配置統計分析的實現方法





