[發(fā)明專利]引入概念標(biāo)簽的神經(jīng)協(xié)同過濾概念描述詞推薦方法有效
| 申請?zhí)枺?/td> | 201810185963.1 | 申請日: | 2018-03-07 |
| 公開(公告)號: | CN108491469B | 公開(公告)日: | 2021-03-30 |
| 發(fā)明(設(shè)計)人: | 魯偉明;劉佳卉;莊越挺;吳飛;魏寶剛 | 申請(專利權(quán))人: | 浙江大學(xué) |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 鄭海峰 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 引入 概念 標(biāo)簽 神經(jīng) 協(xié)同 過濾 描述 推薦 方法 | ||
本發(fā)明公開了一種引入概念標(biāo)簽的神經(jīng)協(xié)同過濾概念描述詞推薦算法。模型引入概念的標(biāo)簽信息知識庫,提高概念的語義向量表達(dá)能力。同時結(jié)合深度神經(jīng)網(wǎng)絡(luò)和經(jīng)典矩陣分解的優(yōu)點,通過廣義矩陣分解和多層感知機(jī)的融合模型擬合概念和描述詞之間的潛在結(jié)構(gòu),得到面向概念的描述詞列表。該算法改善了圖模型計算復(fù)雜且不能保存的缺點,提高了概念、描述詞的隱語義表達(dá)能力。本發(fā)明完成面向概念的描述詞推薦技術(shù)研究及應(yīng)用。針對指定概念,按概念的多側(cè)面描述來組織圖書內(nèi)容,例如對于“二極管”,可以從“特性”、“工作原理”、“作用”等方面來進(jìn)行組織,構(gòu)建概念多側(cè)面描述類專題,為讀者構(gòu)建全面的知識專題。
技術(shù)領(lǐng)域
本發(fā)明涉及一種引入概念標(biāo)簽的神經(jīng)協(xié)同過濾概念描述詞推薦方法。
背景技術(shù)
在數(shù)字圖書館中,人們獲取知識的方式仍以圖書整本閱讀為主要手段。這種知識獲取方式的效率低下,而且由于領(lǐng)域?qū)<业闹R有限,其撰寫的圖書不能涵蓋各個方面,使得用戶通過閱讀單本圖書獲取的知識具有片面性。同時,由于海量圖書導(dǎo)致的“信息過載”問題,用戶也不能快速獲得較為全面權(quán)威的知識。
顯然,用戶希望能在數(shù)字圖書館中獲取盡可能完整的知識,而數(shù)字圖書恰好具有可分解的特性,能用適當(dāng)?shù)闹亟M和歸納方式來組織用戶所需的知識。如果我們能夠按照人們的學(xué)習(xí)認(rèn)知過程來分解、重組和歸納數(shù)字圖書館中的圖書,并引入互聯(lián)網(wǎng)資源,這將極大的幫助人們快速獲取知識。我們稱這種數(shù)字圖書館中的知識組織方式為圖書專題。圖書專題可以分為三類:一類是按照概念的上下級關(guān)系來組織圖書內(nèi)容,例如對于“變壓器”,下級內(nèi)容可以按“三相變壓器”、“二相變壓器”等下級概念來進(jìn)行組織,可稱為概念層次描述類專題;第二類是按某個概念的多側(cè)面描述來組織圖書內(nèi)容,例如對于“二極管”,可以從“特性”、“工作原理”、“作用”等方面來進(jìn)行組織,可稱為概念多側(cè)面描述類專題;第三類是按知識點的時序連貫性來組織圖書內(nèi)容,例如對于“數(shù)據(jù)結(jié)構(gòu)”,可以從“線性表”、“堆棧”、“樹”、“圖”、“查找”、“排序”等方面來組織知識,類似于知識鏈,因此可稱為知識鏈類專題。當(dāng)然,這三類專題形式也可以融合一體。本文主要關(guān)心“概念多側(cè)面描述類專題”的自動生成,即面向概念的描述詞推薦,然后基于推薦的描述詞來組織概念的相關(guān)內(nèi)容。通過概念和描述詞的組合,可以得到知識目錄,如“傳感器的相關(guān)概念”、“傳感器的分類”、“傳感器的特征”,“傳感器的產(chǎn)業(yè)現(xiàn)狀”,通過知識目錄,到圖書中進(jìn)行查找,即可獲取相應(yīng)的內(nèi)容,通過合適的組織方式,在圖書專題系統(tǒng)中進(jìn)行展示,從而豐富知識專題的服務(wù)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種引入概念標(biāo)簽的神經(jīng)協(xié)同過濾概念描述詞推薦方法,為讀者構(gòu)建全面的知識專題。
本發(fā)明解決其技術(shù)問題采用的技術(shù)方案如下:
一種引入概念標(biāo)簽的神經(jīng)協(xié)同過濾概念描述詞推薦方法包括以下步驟:
1)概念標(biāo)簽信息選擇:選定概念詞后,獲取互聯(lián)網(wǎng)百科標(biāo)簽信息以及中圖分類標(biāo)簽信息作預(yù)排序,并對概念詞的標(biāo)簽信息作截斷處理,獲取該概念詞的Top-m標(biāo)簽信息;
2)概念標(biāo)簽向量的引入及融合:對于步驟1)中選取的Top-m標(biāo)簽信息做詞嵌入操作,隨機(jī)初始化后并做池化操作,得到Top-m標(biāo)簽信息向量,并與概念詞的向量進(jìn)行融合訓(xùn)練,使概念詞的向量與標(biāo)簽信息向量映射到同一向量空間,并使概念詞的向量與標(biāo)簽信息向量的距離損失函數(shù)值最小,最終得到概念-標(biāo)簽信息融合向量;
3)引入標(biāo)簽信息的廣義矩陣分解:在神經(jīng)協(xié)同過濾框架下對矩陣分解模型進(jìn)行擴(kuò)展,用神經(jīng)網(wǎng)絡(luò)擬合概念詞和描述詞之間的關(guān)系,并通過模型的損失函數(shù)來學(xué)習(xí)權(quán)重矩陣,利用非線性激活函數(shù)表達(dá)矩陣分解模型;
4)引入標(biāo)簽信息的多層感知機(jī)模型:用多層感知機(jī)模型來學(xué)習(xí)概念詞和描述詞之間的潛在交互信息,選用Relu作為多層感知機(jī)模型的激活函數(shù),對于網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計,遵循塔模式,其中底層是最寬的,并且連續(xù)的神經(jīng)網(wǎng)絡(luò)層的神經(jīng)元逐漸遞減;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810185963.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 瀏覽器中關(guān)閉標(biāo)簽的裝置和方法
- 標(biāo)簽生成方法及標(biāo)簽生成裝置
- 一種帶有標(biāo)簽的電氣插座
- 標(biāo)簽檢測定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 基于樹形結(jié)構(gòu)的標(biāo)簽存儲方法及裝置
- 一種標(biāo)簽分離機(jī)構(gòu)
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 標(biāo)簽檢測定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽轉(zhuǎn)換處理方法、裝置、電子設(shè)備及可讀存儲介質(zhì)
- 用于治療支氣管樹的系統(tǒng)、組件和方法
- 一種頸部神經(jīng)信號記錄方法
- 用于在激活褐色脂肪組織時抑制神經(jīng)的方法和裝置
- 一種神經(jīng)元硬件裝置及用這種裝置模擬脈沖神經(jīng)網(wǎng)絡(luò)的方法
- 神經(jīng)移植物及應(yīng)用其的神經(jīng)移植物系統(tǒng)
- 一種神經(jīng)疏通緩解裝置
- 神經(jīng)移植物及應(yīng)用其的神經(jīng)移植物系統(tǒng)
- 一種模擬神經(jīng)網(wǎng)芯片的設(shè)計方法及模擬神經(jīng)網(wǎng)芯片
- 神經(jīng)網(wǎng)絡(luò)的剪枝方法、裝置、設(shè)備及存儲介質(zhì)
- 一套無人機(jī)神經(jīng)網(wǎng)絡(luò)控制用的人工神經(jīng)元模型





