[發明專利]基于人工智能的圖書自動分類方法有效
| 申請號: | 202110209964.7 | 申請日: | 2021-02-24 |
| 公開(公告)號: | CN112861985B | 公開(公告)日: | 2023-01-31 |
| 發明(設計)人: | 陳淑慧;陳柯明;張艷婷;張旭朣;胡穩 | 申請(專利權)人: | 鄭州輕工業大學 |
| 主分類號: | G06V30/416 | 分類號: | G06V30/416;G06V30/148;G06V30/18;G06V30/19 |
| 代理公司: | 鄭州芝麻知識產權代理事務所(普通合伙) 41173 | 代理人: | 陳長山 |
| 地址: | 450001 河南省鄭州*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 圖書 自動 分類 方法 | ||
本發明提出一種基于人工智能的圖書自動分類方法,該方法包括:采集封面圖像并轉換色彩空間,獲取HSV色彩模型并選取底色;根據底色構建底色鄰域模型,輸出非底色模型和其中的預選像素。根據三維空間中和封面圖像中預選像素的位置進行聚類,獲得若干個第二集合。檢測第二集合中像素外接矩形的特征序列,分析得到文字類型,選擇各種第二集合組成集合組合,獲得集合組合中對應的字符感興趣區域面積并計算集合組合面積評價指數,再根據外接矩形中心點計算集合組合的離散度評價指數。判斷是否需要調整底色,輸出最佳集合組合。根據最佳集合組合中第二集合對應外接矩形從封面圖像中分割出字符檢測區域,檢測關鍵詞并獲得圖書的類別。
技術領域
本申請涉及圖書館資料管理領域、計算機視覺領域,具體涉及一種基于人工智能的圖書自動分類方法。
背景技術
如今全民閱讀的風氣盛行,得益于圖書館等閱讀的基礎設施趨于完善。圖書館中的藏書數量龐大,但如何高效地管理藏書,更好地為讀者提供服務成為圖書館服務人員要面臨的課題。圖書館藏書繁多,讀者在選擇圖書時一般是通過圖書分類索引進行檢索,來獲取感興趣類型的圖書。但是現在圖書館對圖書的分類往往是粗略的分類,分類信息不夠細致、豐富。對讀者檢索感興趣的書籍造成了一定的困難,不利于讀者高效快速地檢索書籍。
現有圖書分類方法一般為人工預先對圖書進行分類,并將各圖書的分類信息導入數據庫中,通過掃碼讀出圖書的分類信息,存在效率低下的問題。而且人工分類考慮的分類維度受限,導致分類信息比較單一,不夠豐富,無法為讀者提供足夠的參考信息。
發明內容
針對以上問題,本發明提出一種基于人工智能的圖書自動分類方法,該方法包括:采集封面圖像并轉換色彩空間,獲取HSV色彩模型并選取底色;根據底色構建底色鄰域模型,輸出非底色模型和其中的預選像素。根據三維空間中和封面圖像中預選像素的位置進行聚類,獲得若干個第二集合。檢測第二集合中像素外接矩形的特征序列,分析得到文字類型,選擇各種第二集合組成集合組合,獲得集合組合中對應的字符感興趣區域面積并計算集合組合面積評價指數,再根據外接矩形中心點計算集合組合的離散度評價指數。判斷是否需要調整底色,輸出最佳集合組合。根據最佳集合組合中第二集合對應外接矩形從封面圖像中分割出字符檢測區域,檢測關鍵詞并獲得圖書的類別。
一種基于人工智能的圖書自動分類方法,該方法包括:
S1、采集封面圖像并轉換色彩空間,再將色彩空間映射到三維空間中得到HSV色彩模型,統計各顏色值包含像素的數量并選取底色;
S2、根據底色的顏色值得到底色鄰域模型,去除HSV色彩模型中屬于底色鄰域模型的區域,得到非底色模型和其中的預選像素;其中,所述底色鄰域模型的獲取方法為:
統計各顏色值包含像素的數量,按從大到小排列得到像素數量序列,選擇像素數量序列中第a個顏色值作為底色,底色的坐標為(x′a,y′a,z′a),初始的a為1;
設置x軸方向閾值mx′、y軸方向閾值my′、z軸方向閾值mz′,底色鄰域模型所占空間為[x′a-mx′,x′a+mx′]、[y′a-my′,y′a+my′]、[z′a-mz′,z′a+mz′];
S3、根據預選像素集合中像素點在三維空間中的顏色值進行第一密度聚類,獲得若干個第一集合;
S4、根據各第一集合中像素點在封面圖像對應圖像坐標系中的位置進行第二密度聚類,獲得若干個第二集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州輕工業大學,未經鄭州輕工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110209964.7/2.html,轉載請聲明來源鉆瓜專利網。





