[發(fā)明專利]高校專利個(gè)性化推薦系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202010031875.3 | 申請(qǐng)日: | 2020-01-13 |
| 公開(公告)號(hào): | CN111259110A | 公開(公告)日: | 2020-06-09 |
| 發(fā)明(設(shè)計(jì))人: | 冉從敬;宋凱 | 申請(qǐng)(專利權(quán))人: | 武漢大學(xué) |
| 主分類號(hào): | G06F16/33 | 分類號(hào): | G06F16/33;G06F16/35 |
| 代理公司: | 武漢科皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 | 代理人: | 石超群 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 高校 專利 個(gè)性化 推薦 系統(tǒng) | ||
本發(fā)明提供了一種高校專利個(gè)性化推薦系統(tǒng),它包括:數(shù)據(jù)檢索與預(yù)處理模塊,檢索得到特定技術(shù)領(lǐng)域的專利數(shù)據(jù),并進(jìn)行自然語言處理,獲取最優(yōu)的分詞結(jié)果集;主題提取與文本聚類模塊,采用LDA模型進(jìn)行主題提取,得到文檔?主題概率矩陣,對(duì)主題進(jìn)行概括;專利數(shù)據(jù)聚類劃分模塊,依據(jù)文檔?主題概率矩陣,運(yùn)用K?means算法進(jìn)行文本聚類;待推薦專利數(shù)據(jù)生成模塊,結(jié)合目標(biāo)企業(yè)的技術(shù)強(qiáng)弱情況,通過相似度計(jì)算生成待推薦的專利數(shù)據(jù)列表,進(jìn)行“數(shù)據(jù)檢索?數(shù)據(jù)處理?數(shù)據(jù)存儲(chǔ)?數(shù)據(jù)分析?數(shù)據(jù)應(yīng)用”的全過程涵蓋自然語言處理、主題建模、文本聚類、相似度計(jì)算等,最終從高校的專利匯總列表中篩選出優(yōu)質(zhì)的專利數(shù)據(jù)推薦給目標(biāo)企業(yè)。
技術(shù)領(lǐng)域
本發(fā)明屬于大數(shù)據(jù)分析處理技術(shù)領(lǐng)域,具體地涉及一種高校專利個(gè)性化推薦系統(tǒng)。
背景技術(shù)
專利(patent),從字面上是指專有的權(quán)利和利益。在現(xiàn)代,專利一般是由政府機(jī)關(guān)或者代表若干國家的區(qū)域性組織根據(jù)申請(qǐng)而頒發(fā)的一種文件,這種文件記載了發(fā)明創(chuàng)造的內(nèi)容,并且在一定時(shí)期內(nèi)產(chǎn)生這樣一種法律狀態(tài),即獲得專利的發(fā)明創(chuàng)造在一般情況下他人只有經(jīng)專利權(quán)人許可才能予以實(shí)施。也就是說,專利是專利權(quán)人對(duì)自己的研發(fā)成果進(jìn)行技術(shù)保護(hù)的一種有效手段。
目前,在各大高校內(nèi),老師或?qū)W生在進(jìn)行科學(xué)研究過程中也會(huì)產(chǎn)生眾多發(fā)明創(chuàng)造,繼而申請(qǐng)了非常多的專利。然而,各大高校面臨的問題是,科研產(chǎn)生的眾多專利僅僅只是申請(qǐng)了專利權(quán),并未進(jìn)行實(shí)際應(yīng)用,而對(duì)該技術(shù)有需求的企業(yè)也很難找到適合自己需求的高校專利資源,造成了大量優(yōu)質(zhì)發(fā)明創(chuàng)造的浪費(fèi)。因此,現(xiàn)有技術(shù)中缺乏一種能夠?qū)⒏咝.a(chǎn)生的優(yōu)質(zhì)專利推薦給有需求的企業(yè)的技術(shù)方案。
發(fā)明內(nèi)容
本發(fā)明是為了解決上述問題而進(jìn)行的,目的在于提供一種能夠有效地將高校的優(yōu)質(zhì)專利推薦給有需求的目標(biāo)企業(yè)的高校專利個(gè)性化推薦系統(tǒng)。
本發(fā)明提供了一種高校專利個(gè)性化推薦系統(tǒng),其特征在于,包括:數(shù)據(jù)檢索與預(yù)處理模塊,基于預(yù)設(shè)技術(shù)領(lǐng)域進(jìn)行檢索得到對(duì)應(yīng)的專利數(shù)據(jù),并對(duì)該專利數(shù)據(jù)進(jìn)行自然語言處理,將文本向量轉(zhuǎn)換成詞向量;對(duì)分詞數(shù)據(jù)集進(jìn)行整理、更新、迭代,獲取最優(yōu)的分詞結(jié)果集;
主題提取與文本聚類模塊,采用LDA模型對(duì)檢索得到的專利數(shù)據(jù)進(jìn)行主題提取,得到文檔-主題概率矩陣,并用最相關(guān)的語義詞對(duì)主題進(jìn)行概括;
專利數(shù)據(jù)聚類劃分模塊,依據(jù)文檔-主題概率矩陣,計(jì)算K-means算法的初始聚類中心值,進(jìn)而運(yùn)用K-means算法進(jìn)行文本聚類,設(shè)置聚類數(shù)、初始聚類中心、迭代次數(shù),從而對(duì)檢索得到的專利數(shù)據(jù)進(jìn)行聚類劃分;以及
待推薦專利數(shù)據(jù)生成模塊,結(jié)合高校專利數(shù)據(jù)與目標(biāo)企業(yè)的技術(shù)強(qiáng)弱情況,通過相似度計(jì)算生成待推薦給所述目標(biāo)企業(yè)的專利數(shù)據(jù)列表。
在本發(fā)明提供的高校專利個(gè)性化推薦系統(tǒng)中,還可以具有這樣的特征,其中,所述數(shù)據(jù)檢索與預(yù)處理模塊執(zhí)行如下處理過程:在檢索得到對(duì)應(yīng)的專利數(shù)據(jù)后,利用R語言的jiebaR包對(duì)檢索得到的專利數(shù)據(jù)進(jìn)行文本分詞、去停用詞、篩選詞等自然語言處理;然后對(duì)分詞結(jié)果集進(jìn)行詞典更新、多輪迭代等最優(yōu)化整理。
在本發(fā)明提供的高校專利個(gè)性化推薦系統(tǒng)中,還可以具有這樣的特征,其中,所述主題提取與文本聚類模塊執(zhí)行如下處理過程:利用R語言的lda包對(duì)檢索得到的專利數(shù)據(jù)進(jìn)行主題提取;利用LDAvis包展示主題可視化結(jié)果,調(diào)整主題數(shù)目、alpha值和beta值,利用多維尺度分析確定最優(yōu)主題數(shù)目、判斷主題模型抽取結(jié)果的優(yōu)異程度;將LDA模型與K-means算法融合,依據(jù)LDA提取的文檔-主題概率矩陣,在K個(gè)主題的維度上確定初始聚類中心,設(shè)置聚類數(shù)、迭代次數(shù),實(shí)現(xiàn)對(duì)檢索得到的專利數(shù)據(jù)進(jìn)行聚類劃分。
在本發(fā)明提供的高校專利個(gè)性化推薦系統(tǒng)中,還可以具有這樣的特征,其中,所述待推薦專利數(shù)據(jù)生成模塊為基于內(nèi)容推薦的數(shù)據(jù)生成模塊,執(zhí)行如下處理過程:確定所述目標(biāo)企業(yè)的技術(shù)重點(diǎn)主題,通過與該重點(diǎn)主題下的專利進(jìn)行平均主題相似度計(jì)算對(duì)高校專利匯總列表進(jìn)行篩選,從而生成基于內(nèi)容推薦的高校專利列表。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大學(xué),未經(jīng)武漢大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010031875.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于云存儲(chǔ)的校園資源共享方法
- 一種高校教師當(dāng)前的科研能力評(píng)價(jià)模型及系統(tǒng)
- 一種高校科研信息管理系統(tǒng)及其管理方法
- 基于互聯(lián)網(wǎng)的高校文化創(chuàng)意培育與轉(zhuǎn)讓系統(tǒng)
- 一種高校無線網(wǎng)建設(shè)前規(guī)劃方法和裝置
- 一種用于高校的信息管理系統(tǒng)
- 一種高考志愿填報(bào)輔助系統(tǒng)
- 一種院校實(shí)驗(yàn)室共享管理系統(tǒng)
- 一種校園安全教育管理系統(tǒng)
- 一種財(cái)務(wù)決策大數(shù)據(jù)分析系統(tǒng)
- 頻道信息生成、訪問控制、交付方法、IPTV系統(tǒng)及裝置
- 向個(gè)性化回鈴音用戶提供網(wǎng)絡(luò)閃鈴的方法
- 一種個(gè)性化設(shè)置的控制方法、系統(tǒng)及設(shè)備
- 個(gè)性化配置應(yīng)用功能的方法和裝置
- 瀏覽器新建標(biāo)簽頁的展現(xiàn)方法和瀏覽器客戶端
- 一觸式設(shè)備個(gè)性化
- 一種跨媒介個(gè)性化推薦方法和系統(tǒng)
- 基于大數(shù)據(jù)的證券資訊個(gè)性化服務(wù)系統(tǒng)
- 一種個(gè)性化的交易員教學(xué)自動(dòng)推薦方法和系統(tǒng)
- 實(shí)物禮品的個(gè)性化處理方法、裝置、設(shè)備和可讀存儲(chǔ)介質(zhì)





