[發(fā)明專利]一種基于遞歸神經(jīng)網(wǎng)絡(luò)的摘要生成方法在審
| 申請?zhí)枺?/td> | 201710099638.9 | 申請日: | 2017-02-23 |
| 公開(公告)號(hào): | CN106933785A | 公開(公告)日: | 2017-07-07 |
| 發(fā)明(設(shè)計(jì))人: | 賈江龍;劉聰 | 申請(專利權(quán))人: | 中山大學(xué) |
| 主分類號(hào): | G06F17/22 | 分類號(hào): | G06F17/22;G06N3/02 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司44102 | 代理人: | 林麗明 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 遞歸 神經(jīng)網(wǎng)絡(luò) 摘要 生成 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及神經(jīng)網(wǎng)絡(luò)領(lǐng)域,更具體地,涉及一種基于遞歸神經(jīng)網(wǎng)絡(luò)的摘要生成方法。
背景技術(shù)
摘要生成是自然語言處理領(lǐng)域的一個(gè)重要問題,它主要有兩種不同的形式:一種是生成源文的主旨,另一種是生成源文的標(biāo)題。前者一般比較長,可能包括數(shù)十個(gè)字或者詞,而后者相對比較短,一般只有十個(gè)字左右。摘要是源文的高度性概括,它必須簡單明了的表達(dá)源文的意思。傳統(tǒng)的摘要生成方法可以分為三個(gè)步驟:一、根據(jù)某個(gè)標(biāo)準(zhǔn)(例如分詞)將源文分割成很多個(gè)小片斷;二、根據(jù)每個(gè)片斷的權(quán)重(例如tf-idf),從中選擇出權(quán)重比較大的那些片斷;三、根據(jù)某種算法將那些權(quán)重較大的片斷組合成新的句子,作為源文的摘要。
現(xiàn)有技術(shù)提供了一種基于基于遞歸神經(jīng)網(wǎng)絡(luò)編碼器與解碼器的摘要生成方法,該方法實(shí)際上是一個(gè)序列到序列的機(jī)器學(xué)習(xí)過程,它的輸入可以是一個(gè)句子,一個(gè)段落或者一篇文章,它的輸出是相應(yīng)輸入的主旨或者標(biāo)題,因此輸入和輸出都可以看作是由字或者詞組成的時(shí)間序列。與傳統(tǒng)的摘要生成方法相比,這是一種抽象的摘要生成過程。其根據(jù)給定的輸入序列,方法通過在整個(gè)詞表中遞歸地搜索關(guān)鍵詞來從前向后組成一個(gè)新的句子作為輸出序列,即摘要信息。
其中遞歸神經(jīng)網(wǎng)絡(luò)編碼器的作用是利用遞歸神經(jīng)網(wǎng)絡(luò)將給定的輸入序列轉(zhuǎn)換或者映射成為一個(gè)中間表達(dá)式,即將輸入的段落或者文章轉(zhuǎn)換成一個(gè)向量表達(dá)式H。假設(shè)輸入序列為:X={x1,x2,…,xn},其中n表示輸入序列的長度。如圖1所示,編碼器的作用可以用以下表達(dá)式來表示:
ht=f(xt,ht-1)
其中,xt表示輸入序列中第t個(gè)元素的相應(yīng)向量,ht表示t時(shí)刻編碼器的狀態(tài)向量,f和表示非線性映射函數(shù)。H表示輸入序列的向量表達(dá)式,一般情況下取H=hn即可,即用遞歸神經(jīng)網(wǎng)絡(luò)編碼器的最后時(shí)刻的狀態(tài)向量作為輸入序列的中間向量表達(dá)式。eos是一個(gè)特殊標(biāo)記,表示著輸入序列的終止,以及編碼器工作的結(jié)束和解碼器工作的開始。
相應(yīng)的,遞歸神經(jīng)網(wǎng)絡(luò)解碼器的作用是利用編碼器生成的中間向量表達(dá)式H來生成輸出序列。假設(shè)輸出序列為:Y={y1,y2,…,ym},其中m表示輸出序列的長度。需要注意的是,解碼器并不是一次性生成整個(gè)輸出序列,而是按照從前往后的順序每個(gè)時(shí)刻生成輸出順序的一個(gè)字或者一個(gè)詞,直到生成整個(gè)輸出序列為止。如圖2所示,解碼器的作用可以用以下表達(dá)式來表示:
P(yt|y1,...,yt-1,H)=g(st,H)
st=f(yt-1,st-1)
其中,P(Y│X)表示根據(jù)輸入X得到輸入Y的概率;yt表示輸出序列中第t時(shí)刻的解碼出的字或詞,st表示t時(shí)刻解碼器的狀態(tài)向量。f和g表示非線性轉(zhuǎn)換函數(shù),這里g采用softmax函數(shù)。
上述方案中,基于遞歸神經(jīng)網(wǎng)絡(luò)編碼器與解碼器的摘要生成方法有一個(gè)不足,即輸出序列的生成只與編碼器的最后時(shí)刻的狀態(tài)向量有關(guān),但與編碼器中的其它狀態(tài)向量無關(guān)。當(dāng)遞歸神經(jīng)網(wǎng)絡(luò)的長度增加的時(shí)候,遞歸神經(jīng)網(wǎng)絡(luò)抽取的特征向量往往與輸入序列后面的狀態(tài)關(guān)聯(lián)性增加,但與輸入序列前面的狀態(tài)關(guān)聯(lián)性減少,這就可能會(huì)造成信息的衰減。因此只根據(jù)編碼器的最后狀態(tài)來解碼會(huì)造成輸出序列與輸入序列之間的關(guān)聯(lián)性變?nèi)酢?/p>
發(fā)明內(nèi)容
本發(fā)明為解決以上現(xiàn)有技術(shù)在解碼的過程中會(huì)造成信息衰減的缺陷,提供了一種基于遞歸神經(jīng)網(wǎng)絡(luò)的摘要生成方法
為實(shí)現(xiàn)以上發(fā)明目的,采用的技術(shù)方案是:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué),未經(jīng)中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710099638.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





