[發(fā)明專利]一種基于人工智能的圖書(shū)分類(lèi)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810554466.4 | 申請(qǐng)日: | 2018-05-17 |
| 公開(kāi)(公告)號(hào): | CN108875808A | 公開(kāi)(公告)日: | 2018-11-23 |
| 發(fā)明(設(shè)計(jì))人: | 高桂玲;折宇超 | 申請(qǐng)(專利權(quán))人: | 延安職業(yè)技術(shù)學(xué)院 |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62;G06N3/04 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 716000*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 成熟模型 人工智能 圖書(shū)分類(lèi) 轉(zhuǎn)化 讀取 工作自動(dòng)化 工作效率 特征向量 拼音 分類(lèi) 節(jié)約 | ||
1.一種基于人工智能的圖書(shū)分類(lèi)方法,其特征在于,包括如下步驟:
步驟一、對(duì)于現(xiàn)有的圖書(shū)進(jìn)行成熟模型訓(xùn)練;
首先讀取所有圖書(shū)的名稱及對(duì)應(yīng)書(shū)架并將圖書(shū)名稱轉(zhuǎn)化為拼音,通過(guò)n-gram結(jié)合word2Vec或者TF-IDF進(jìn)行分詞形成特征向量,其中,n為大于等于1的正整數(shù),然后根據(jù)書(shū)架所屬的圖書(shū)種類(lèi)個(gè)數(shù)確定分類(lèi)個(gè)數(shù);
將已有圖書(shū)的特征向量及對(duì)應(yīng)的書(shū)架號(hào)分為3塊,比例分別為6∶2∶2.其中60%用于訓(xùn)練模型,20%用于測(cè)試訓(xùn)練精度并不斷調(diào)整模型已使測(cè)試精度達(dá)到最高,剩余的20%用于實(shí)際測(cè)量精度;此時(shí),通過(guò)模型庫(kù)中的模型對(duì)60%的圖書(shū)數(shù)據(jù)圖書(shū)特征向量進(jìn)行分類(lèi),得出訓(xùn)練模型并使用20%的數(shù)據(jù)作為測(cè)試數(shù)據(jù)對(duì)模型進(jìn)行評(píng)測(cè),得到精度最高的模型,并用剩余20%的數(shù)據(jù)進(jìn)行實(shí)測(cè),選擇此時(shí)精度最高的模型作為成熟模型;
步驟二、當(dāng)新進(jìn)圖書(shū)時(shí),首先讀取所有新進(jìn)圖書(shū)的圖書(shū)名稱,并將其轉(zhuǎn)化為拼音,將其按照成熟模型中的分冊(cè)的方法轉(zhuǎn)化進(jìn)一步轉(zhuǎn)化為特征向量,然后使用成熟模型對(duì)圖書(shū)進(jìn)行分類(lèi),得到新圖書(shū)所屬的書(shū)架號(hào)。
2.如權(quán)利要求1所述的一種基于人工智能的圖書(shū)分類(lèi)方法,其特征在于,所述步驟一選用隨機(jī)森林作為分類(lèi)器進(jìn)行訓(xùn)練得到成熟模型;首先提取對(duì)已有圖書(shū)的拼音和對(duì)應(yīng)的書(shū)架,對(duì)拼音進(jìn)行n-gram劃分,對(duì)于劃分出的字母組合使用word2vec或者TF-IDF進(jìn)行數(shù)字變換,變換后按3∶1∶1分成第一份、第二份、第三份,然后按照如下步驟進(jìn)行模型調(diào)優(yōu):
S1、調(diào)節(jié)隨機(jī)森林模型參數(shù),包括但不限于樹(shù)的最大深度和樹(shù)的最大數(shù)量,調(diào)節(jié)完畢后使用第一份數(shù)據(jù)進(jìn)行訓(xùn)練并使用評(píng)估函數(shù)進(jìn)行評(píng)估,選出最優(yōu)值;
S2、使用第二份數(shù)據(jù)對(duì)模型進(jìn)行評(píng)測(cè),通過(guò)評(píng)估函數(shù)進(jìn)行評(píng)估并修正模型;
S3、重復(fù)執(zhí)行步驟S1-步驟S2,直到滿足條件為止;
確定模型之后使用第三份數(shù)據(jù)進(jìn)行實(shí)測(cè),則此時(shí)的評(píng)估函數(shù)則為實(shí)測(cè)值。
3.如權(quán)利要求1所述的一種基于人工智能的圖書(shū)分類(lèi)方法,其特征在于,所述步驟一選用神經(jīng)網(wǎng)絡(luò)甚至深度學(xué)習(xí)網(wǎng)絡(luò)作為分類(lèi)器進(jìn)行訓(xùn)練得到成熟模型;按如下順序進(jìn)行:
S1、提取對(duì)已有圖書(shū)的拼音和對(duì)應(yīng)的書(shū)架,對(duì)拼音進(jìn)行n-gram劃分,對(duì)于劃分出的字母組合使用word2vec或者TF-IDF進(jìn)行數(shù)字變換,變換后按3∶1∶1分成第一份、第二份、第三份;
S2、確定神經(jīng)網(wǎng)絡(luò)參數(shù)并調(diào)優(yōu),包括但不限于輸入特征值、輸出分類(lèi)個(gè)數(shù)、
隱藏層個(gè)數(shù)、隱藏節(jié)點(diǎn)函數(shù),使用第二份數(shù)據(jù)對(duì)模型進(jìn)行評(píng)測(cè),即輸入拼音,輸出分類(lèi)書(shū)架結(jié)果,通過(guò)評(píng)估函數(shù)進(jìn)行評(píng)估并修正模型;
S3、重復(fù)執(zhí)行步驟S1-步驟S2,直到滿足條件為止;
確定模型之后使用第三份數(shù)據(jù)進(jìn)行實(shí)測(cè),則此時(shí)的評(píng)估函數(shù)為實(shí)測(cè)值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于延安職業(yè)技術(shù)學(xué)院,未經(jīng)延安職業(yè)技術(shù)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810554466.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種基于多注意力多尺度的圖像描述方法
- 下一篇:聯(lián)合attention機(jī)制與神經(jīng)網(wǎng)絡(luò)的生物醫(yī)學(xué)實(shí)體關(guān)系分類(lèi)方法
- 同類(lèi)專利
- 專利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 咖啡成熟果實(shí)的檢測(cè)方法、裝置及電子設(shè)備
- 一種基于CMMI模型的軟件研發(fā)過(guò)程改進(jìn)系統(tǒng)及方法
- 模型成熟度的評(píng)估方法及裝置
- 一種網(wǎng)絡(luò)安全成熟度的計(jì)算方法和模型
- 一種西瓜成熟狀態(tài)檢測(cè)方法、設(shè)備及介質(zhì)
- 一種組合模型成熟度評(píng)估方法和裝置
- 基于多元數(shù)據(jù)的技術(shù)成熟度綜合判斷方法、系統(tǒng)及介質(zhì)
- 一種基于BP神經(jīng)網(wǎng)絡(luò)的香蕉成熟度檢測(cè)方法及裝置
- 一種氫能技術(shù)成熟度的評(píng)估方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 基于成熟度模型的微服務(wù)成熟度評(píng)估方法及其系統(tǒng)
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人
- 一種圖書(shū)推薦方法
- 一種網(wǎng)上圖書(shū)銷(xiāo)售系統(tǒng)
- 圖書(shū)館圖書(shū)自動(dòng)分類(lèi)設(shè)備及其工作方法
- 一種基于物聯(lián)網(wǎng)的校園圖書(shū)館綜合服務(wù)管理系統(tǒng)
- 一種分類(lèi)數(shù)據(jù)庫(kù)的構(gòu)建方法以及圖書(shū)分類(lèi)的方法
- 一種舊圖書(shū)的自動(dòng)分類(lèi)方法
- 一種圖書(shū)自動(dòng)分類(lèi)方法
- 圖書(shū)分類(lèi)方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于LDA主題模型的圖書(shū)自動(dòng)分類(lèi)方法
- 一種基于手機(jī)端的信息咨詢管理系統(tǒng)





