[發(fā)明專(zhuān)利]應(yīng)用分類(lèi)方法和應(yīng)用分類(lèi)裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201610395414.8 | 申請(qǐng)日: | 2016-06-06 |
| 公開(kāi)(公告)號(hào): | CN107463935A | 公開(kāi)(公告)日: | 2017-12-12 |
| 發(fā)明(設(shè)計(jì))人: | 王躍;路博;王瓊;劉思言;王洪嶺;鄧琳碧 | 申請(qǐng)(專(zhuān)利權(quán))人: | 工業(yè)和信息化部電信研究院 |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62;G06F17/30 |
| 代理公司: | 北京酷愛(ài)智慧知識(shí)產(chǎn)權(quán)代理有限公司11514 | 代理人: | 李娜 |
| 地址: | 100191 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 應(yīng)用 分類(lèi) 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及應(yīng)用分類(lèi)領(lǐng)域,具體的說(shuō)是一種應(yīng)用分類(lèi)方法和一種應(yīng)用分類(lèi)裝置。
背景技術(shù)
隨著智能手機(jī)、平板電腦等智能終端的迅速普及,基于IOS操作系統(tǒng)、android操作系統(tǒng)和windows操作系統(tǒng)的各種應(yīng)用程序(英文縮寫(xiě):App;英文全稱(chēng):Application)已從社交、購(gòu)物、交通、服務(wù)、醫(yī)療、通訊等各個(gè)領(lǐng)域深入消費(fèi)者的生活中,應(yīng)用程序的總數(shù)量呈爆發(fā)式增長(zhǎng),目前,基于IOS操作系統(tǒng)的App總數(shù)已超過(guò)150萬(wàn),而基于開(kāi)源的android操作系統(tǒng)的App數(shù)量更加龐大,這些App在互聯(lián)網(wǎng)中的各大應(yīng)用商店中上架,以供用戶(hù)下載安裝。
由于A(yíng)pp發(fā)展是互聯(lián)網(wǎng)發(fā)展的重要方面,根據(jù)App的規(guī)模、分類(lèi)等情況可以宏觀(guān)了解互聯(lián)網(wǎng)科技的發(fā)展方向,對(duì)政府、企業(yè)、個(gè)人等均具有重要的指導(dǎo)作用,因此,需要了解市場(chǎng)上所有App整體的分類(lèi)情況。
目前,國(guó)內(nèi)有幾十個(gè)應(yīng)用商店,各個(gè)應(yīng)用商店的規(guī)模不同,上架的App千差萬(wàn)別,各個(gè)應(yīng)用商店對(duì)App的分類(lèi)類(lèi)目各不相同,對(duì)各個(gè)App的分類(lèi)也不盡相同,對(duì)同一個(gè)應(yīng)用商店的數(shù)據(jù)尚可以進(jìn)行分類(lèi)匯總,但對(duì)多個(gè)應(yīng)用商店的數(shù)據(jù)就無(wú)法統(tǒng)一進(jìn)行分類(lèi)匯總了,以上現(xiàn)狀對(duì)統(tǒng)計(jì)市場(chǎng)上所有App的整體分類(lèi)情況造成了阻礙,現(xiàn)有技術(shù)中缺少能夠?qū)κ袌?chǎng)上的App進(jìn)行統(tǒng)一分類(lèi)的方法。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,迫切需要一種能夠?qū)κ袌?chǎng)上的App進(jìn)行統(tǒng)一分類(lèi)的應(yīng)用分類(lèi)方法,以及相應(yīng)的一種應(yīng)用分類(lèi)裝置。
本發(fā)明采用的技術(shù)方案是:
本申請(qǐng)?zhí)峁┮环N應(yīng)用分類(lèi)方法,包括:
獲取待分類(lèi)數(shù)據(jù),其中,所述待分類(lèi)數(shù)據(jù)包括待分類(lèi)應(yīng)用的應(yīng)用名稱(chēng)和應(yīng)用描述;
對(duì)所述待分類(lèi)數(shù)據(jù)中的應(yīng)用名稱(chēng)和應(yīng)用描述進(jìn)行分詞處理,獲得所述待分類(lèi)應(yīng)用的多個(gè)關(guān)鍵詞;
根據(jù)所述多個(gè)關(guān)鍵詞獲得所述待分類(lèi)應(yīng)用的分類(lèi)名稱(chēng)。
可選的,所述對(duì)所述待分類(lèi)數(shù)據(jù)中的應(yīng)用名稱(chēng)和應(yīng)用描述進(jìn)行分詞處理,獲得所述應(yīng)用的多個(gè)關(guān)鍵詞的步驟,包括:
對(duì)所述待分類(lèi)數(shù)據(jù)中的應(yīng)用名稱(chēng)和應(yīng)用描述采用ICTCLAS、IKAnalyzer、盤(pán)古分詞、庖丁中文分詞、LibMMSeg、PHPCWS、HTTPCWS、mmseg4j、smallseg、CRF、SCWS、FudanNLP和ICTCLAS4j中的任一種分詞工具進(jìn)行分詞處理,獲得所述應(yīng)用的多個(gè)關(guān)鍵詞。
可選的,所述根據(jù)所述多個(gè)關(guān)鍵詞獲得所述待分類(lèi)應(yīng)用的分類(lèi)名稱(chēng)的步驟具體包括:
獲取由多條訓(xùn)練數(shù)據(jù)組成的訓(xùn)練樣本,其中,每條所述訓(xùn)練數(shù)據(jù)包括一個(gè)已確定分類(lèi)的訓(xùn)練應(yīng)用的應(yīng)用名稱(chēng)、應(yīng)用描述和分類(lèi)名稱(chēng);
對(duì)每條所述訓(xùn)練數(shù)據(jù)中的應(yīng)用名稱(chēng)和應(yīng)用描述進(jìn)行分詞處理,獲得每個(gè)訓(xùn)練應(yīng)用的多個(gè)關(guān)鍵詞,所有所述訓(xùn)練應(yīng)用的關(guān)鍵詞和分類(lèi)名稱(chēng)共同組成樸素貝葉斯分類(lèi)器的訓(xùn)練樣本;
采用所述訓(xùn)練樣本訓(xùn)練樸素貝葉斯分類(lèi)器,獲得訓(xùn)練好的樸素貝葉斯分類(lèi)器;
采用測(cè)試樣本測(cè)試所述訓(xùn)練好的樸素貝葉斯分類(lèi)器的準(zhǔn)確度;
判斷所述準(zhǔn)確度是否達(dá)到預(yù)期值,若未達(dá)到,則按照用戶(hù)的指令在所述訓(xùn)練樣本中刪除至少一條訓(xùn)練數(shù)據(jù),重新訓(xùn)練樸素貝葉斯分類(lèi)器并測(cè)試訓(xùn)練好的樸素貝葉斯分類(lèi)器的準(zhǔn)確度,重復(fù)執(zhí)行本步驟直至所述準(zhǔn)確度達(dá)到預(yù)期值;
將所述多個(gè)關(guān)鍵詞輸入訓(xùn)練好的樸素貝葉斯分類(lèi)器中進(jìn)行分類(lèi),獲得所述待分類(lèi)應(yīng)用的分類(lèi)名稱(chēng)。
可選的,所述獲取待分類(lèi)數(shù)據(jù)的步驟,包括:
采用網(wǎng)絡(luò)爬取方法從不同應(yīng)用商店中爬取待分類(lèi)數(shù)據(jù)。
可選的,所述采用網(wǎng)絡(luò)爬取方法從不同應(yīng)用商店中爬取待分類(lèi)數(shù)據(jù)的步驟,包括:
采用nutch爬蟲(chóng)從不同應(yīng)用商店中爬取待分類(lèi)數(shù)據(jù)。
本申請(qǐng)還提供一種應(yīng)用分類(lèi)裝置,包括:
待分類(lèi)數(shù)據(jù)獲取模塊,用于獲取待分類(lèi)數(shù)據(jù),其中,所述待分類(lèi)數(shù)據(jù)包括待分類(lèi)應(yīng)用的應(yīng)用名稱(chēng)和應(yīng)用描述;
待分類(lèi)數(shù)據(jù)分詞模塊,用于對(duì)所述待分類(lèi)數(shù)據(jù)中的應(yīng)用名稱(chēng)和應(yīng)用描述進(jìn)行分詞處理,獲得所述待分類(lèi)應(yīng)用的多個(gè)關(guān)鍵詞;
分類(lèi)模塊,用于根據(jù)所述多個(gè)關(guān)鍵詞獲得所述待分類(lèi)應(yīng)用的分類(lèi)名稱(chēng)。
可選的,所述待分類(lèi)數(shù)據(jù)分詞模塊包括:
待分類(lèi)數(shù)據(jù)分詞單元,用于對(duì)所述待分類(lèi)數(shù)據(jù)中的應(yīng)用名稱(chēng)和應(yīng)用描述采用ICTCLAS、IKAnalyzer、盤(pán)古分詞、庖丁中文分詞、LibMMSeg、PHPCWS、HTTPCWS、mmseg4j、smallseg、CRF、SCWS、FudanNLP和ICTCLAS4j中的任一種分詞工具進(jìn)行分詞處理,獲得所述應(yīng)用的多個(gè)關(guān)鍵詞。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于工業(yè)和信息化部電信研究院,未經(jīng)工業(yè)和信息化部電信研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610395414.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:淋浴托盤(pán)
- 下一篇:月餅包裝盒(中秋月餅5)
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 在線(xiàn)應(yīng)用平臺(tái)上應(yīng)用間通信的回調(diào)應(yīng)答方法、應(yīng)用及在線(xiàn)應(yīng)用平臺(tái)
- 應(yīng)用使用方法、應(yīng)用使用裝置及相應(yīng)的應(yīng)用終端
- 應(yīng)用管理設(shè)備、應(yīng)用管理系統(tǒng)、以及應(yīng)用管理方法
- 能力應(yīng)用系統(tǒng)及其能力應(yīng)用方法
- 應(yīng)用市場(chǎng)的應(yīng)用搜索方法、系統(tǒng)及應(yīng)用市場(chǎng)
- 使用應(yīng)用的方法和應(yīng)用平臺(tái)
- 應(yīng)用安裝方法和應(yīng)用安裝系統(tǒng)
- 使用遠(yuǎn)程應(yīng)用進(jìn)行應(yīng)用安裝
- 應(yīng)用檢測(cè)方法及應(yīng)用檢測(cè)裝置
- 應(yīng)用調(diào)用方法、應(yīng)用發(fā)布方法及應(yīng)用發(fā)布系統(tǒng)
- 數(shù)據(jù)分類(lèi)的方法和裝置
- 一種圖像分類(lèi)方法及裝置
- 報(bào)文分類(lèi)方法及網(wǎng)絡(luò)設(shè)備
- 一種短文本多標(biāo)簽分類(lèi)方法及裝置
- 一種高正確率的自然語(yǔ)言分類(lèi)器系統(tǒng)
- 多分類(lèi)模型優(yōu)化方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種基于神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)方法和裝置
- 一種塑料大小分類(lèi)機(jī)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





