[發(fā)明專(zhuān)利]一種并行非監(jiān)督文本分類(lèi)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011521814.1 | 申請(qǐng)日: | 2020-12-21 |
| 公開(kāi)(公告)號(hào): | CN112818116A | 公開(kāi)(公告)日: | 2021-05-18 |
| 發(fā)明(設(shè)計(jì))人: | 杜少波 | 申請(qǐng)(專(zhuān)利權(quán))人: | 貴州商學(xué)院 |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06K9/62 |
| 代理公司: | 廣東有知貓知識(shí)產(chǎn)權(quán)代理有限公司 44681 | 代理人: | 崔新芬 |
| 地址: | 550014 貴*** | 國(guó)省代碼: | 貴州;52 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 并行 監(jiān)督 文本 分類(lèi) 方法 | ||
1.一種并行非監(jiān)督文本分類(lèi)方法,其特征在于:包括如下步驟:
計(jì)算中心點(diǎn):采用層次聚類(lèi)算法或密度聚類(lèi)算法,計(jì)算向量化文本數(shù)據(jù)的中心點(diǎn);
切分計(jì)算:基于模糊聚類(lèi)算法,以每一中心點(diǎn)的計(jì)算為一路,采用多路并行的方式進(jìn)行隸屬度計(jì)算;
輸出結(jié)果:將隸屬度計(jì)算的結(jié)果作為輸出結(jié)果返回。
2.如權(quán)利要求1所述的并行非監(jiān)督文本分類(lèi)方法,其特征在于:所述步驟計(jì)算中心點(diǎn)中,采用Canopy算法計(jì)算。
3.如權(quán)利要求1所述的并行非監(jiān)督文本分類(lèi)方法,其特征在于:所述步驟切分計(jì)算中,基于模糊C均值聚類(lèi)算法進(jìn)行計(jì)算。
4.如權(quán)利要求2所述的并行非監(jiān)督文本分類(lèi)方法,其特征在于:所述采用Canopy算法計(jì)算過(guò)程中,以最大點(diǎn)密度值點(diǎn)作為聚類(lèi)中心點(diǎn)。
5.如權(quán)利要求2所述的并行非監(jiān)督文本分類(lèi)方法,其特征在于:所述采用Canopy算法計(jì)算過(guò)程中,以最大權(quán)重值點(diǎn)作為聚類(lèi)中心點(diǎn),最大權(quán)重值基于樣本點(diǎn)的周?chē)c(diǎn)數(shù)量、緊密度和簇相似度計(jì)算。
6.如權(quán)利要求5所述的并行非監(jiān)督文本分類(lèi)方法,其特征在于:所述最大權(quán)重值以如下公式進(jìn)行計(jì)算:
其中:ρi為樣本點(diǎn)的周?chē)c(diǎn)數(shù)量,αi為樣本點(diǎn)的緊密度,即樣本點(diǎn)的周?chē)c(diǎn)距離均值,si為樣本點(diǎn)的簇相似度,即樣本點(diǎn)所在簇和其他簇之間的簇相似度。
7.如權(quán)利要求4或6所述的并行非監(jiān)督文本分類(lèi)方法,其特征在于:采用最大點(diǎn)密度值點(diǎn)作為第一聚類(lèi)中心點(diǎn),除第一聚類(lèi)中心點(diǎn)所在簇之外其他點(diǎn)的最大權(quán)重值點(diǎn)作為第二聚類(lèi)中心點(diǎn)。
8.如權(quán)利要求1所述的并行非監(jiān)督文本分類(lèi)方法,其特征在于:所述多路并行的方式通過(guò)Spark環(huán)境實(shí)現(xiàn)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于貴州商學(xué)院,未經(jīng)貴州商學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011521814.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議設(shè)備的數(shù)據(jù)并行采集歸并方法及系統(tǒng)
- 減少EMI的并行數(shù)據(jù)傳輸方法
- 一種多媒體數(shù)據(jù)并行處理系統(tǒng)及方法
- 一種高速并行OQPSK解調(diào)時(shí)鐘的恢復(fù)系統(tǒng)
- 一種海量地震數(shù)據(jù)并行抽道集方法
- 3G協(xié)議的turbo碼并行譯碼方法及裝置
- 并行擴(kuò)展輸入輸出的教學(xué)裝置
- 數(shù)據(jù)的并行處理
- 并行式插件機(jī)
- 一種SPI總線(xiàn)與并行總線(xiàn)的橋接方法、設(shè)備、系統(tǒng)及介質(zhì)
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺(jué)訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺(jué)系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 數(shù)據(jù)分類(lèi)的方法和裝置
- 一種圖像分類(lèi)方法及裝置
- 報(bào)文分類(lèi)方法及網(wǎng)絡(luò)設(shè)備
- 一種短文本多標(biāo)簽分類(lèi)方法及裝置
- 一種高正確率的自然語(yǔ)言分類(lèi)器系統(tǒng)
- 多分類(lèi)模型優(yōu)化方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種基于神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)方法和裝置
- 一種塑料大小分類(lèi)機(jī)





