[發(fā)明專(zhuān)利]摘要生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010188547.4 | 申請(qǐng)日: | 2020-03-17 |
| 公開(kāi)(公告)號(hào): | CN111400454A | 公開(kāi)(公告)日: | 2020-07-10 |
| 發(fā)明(設(shè)計(jì))人: | 王明軒;李磊 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06F16/33 | 分類(lèi)號(hào): | G06F16/33;G06F16/35;G06F40/30;G06F40/58;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 北京遠(yuǎn)智匯知識(shí)產(chǎn)權(quán)代理有限公司 11659 | 代理人: | 范坤坤 |
| 地址: | 100041 北京市石景山區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 摘要 生成 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種摘要生成方法,其特征在于,包括:
獲取至少一個(gè)源文本;
獲取至少一個(gè)目標(biāo)語(yǔ)言;
將至少一個(gè)源文本和與各所述目標(biāo)語(yǔ)言匹配的指示信息輸入到預(yù)先訓(xùn)練的摘要生成模型中,所述摘要生成模型用于將至少一個(gè)第一文本簡(jiǎn)化為至少一個(gè)第二文本,同時(shí)將各所述第一文本對(duì)應(yīng)的第一語(yǔ)言集合中的語(yǔ)言分別翻譯成第二語(yǔ)言集合中的至少一個(gè)語(yǔ)言,并分別作為各所述第二文本對(duì)應(yīng)的語(yǔ)言,所述第一語(yǔ)言集合包括多個(gè)語(yǔ)言,所述第一語(yǔ)言集合包括各所述源文本分別對(duì)應(yīng)的待翻譯語(yǔ)言,所述第二語(yǔ)言集合包括多個(gè)語(yǔ)言,所述第二語(yǔ)言集合包括各所述目標(biāo)語(yǔ)言;
獲取所述摘要生成模型輸出的分別與各所述目標(biāo)語(yǔ)言對(duì)應(yīng)的摘要文本。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取至少一個(gè)源文本,包括:
獲取至少兩個(gè)源文本,各所述源文本對(duì)應(yīng)的待翻譯語(yǔ)言不同;
所述將至少一個(gè)源文本和與各所述目標(biāo)語(yǔ)言匹配的指示信息輸入到預(yù)先訓(xùn)練的摘要生成模型中,包括:
如果各所述源文本滿足語(yǔ)義相似條件,則將至少兩個(gè)源文本和與各所述目標(biāo)語(yǔ)言匹配的指示信息輸入到預(yù)先訓(xùn)練的摘要生成模型中。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取至少一個(gè)目標(biāo)語(yǔ)言,包括:
獲取至少兩個(gè)目標(biāo)語(yǔ)言,各所述目標(biāo)語(yǔ)言不同。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述摘要生成模型為Seq2Seq模型,所述摘要生成模型包括編碼器和解碼器;其中,所述編碼器和所述解碼器的總數(shù)量為至少三個(gè),不同編碼器對(duì)應(yīng)不同源文本,不同解碼器對(duì)應(yīng)不同目標(biāo)語(yǔ)言。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獲取所述摘要生成模型輸出的分別與各所述目標(biāo)語(yǔ)言對(duì)應(yīng)的摘要文本,包括:
通過(guò)所述摘要生成模型中的多個(gè)編碼器分別提取對(duì)應(yīng)的源文本中的源文本序列片段,并進(jìn)行融合編碼,形成所述源文本的目標(biāo)特征向量;
通過(guò)所述摘要生成模型中的解碼器根據(jù)所述目標(biāo)特征向量和所述目標(biāo)語(yǔ)言,將所述目標(biāo)特征向量映射為目標(biāo)語(yǔ)言的文本序列,作為摘要文本。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獲取所述摘要生成模型輸出的分別與各所述目標(biāo)語(yǔ)言對(duì)應(yīng)的摘要文本,包括:
通過(guò)所述摘要生成模型中的編碼器提取所述源文本中的源文本序列片段,并進(jìn)行編碼,形成所述源文本的目標(biāo)特征向量;
通過(guò)所述摘要生成模型中的多個(gè)解碼器分別根據(jù)各所述目標(biāo)語(yǔ)言,分別將所述目標(biāo)特征向量映射為文本序列,確定各所述解碼器對(duì)應(yīng)的摘要文本。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獲取所述摘要生成模型輸出的分別與各所述目標(biāo)語(yǔ)言對(duì)應(yīng)的摘要文本,包括:
通過(guò)所述摘要生成模型中的多個(gè)編碼器分別提取對(duì)應(yīng)的源文本中的源文本序列片段,并進(jìn)行融合編碼,形成所述源文本的目標(biāo)特征向量;
通過(guò)所述摘要生成模型中的多個(gè)解碼器分別根據(jù)各所述目標(biāo)語(yǔ)言,分別將所述目標(biāo)特征向量映射為文本序列,確定各所述解碼器對(duì)應(yīng)的摘要文本。
8.一種摘要生成裝置,其特征在于,包括:
源文本獲取模塊,用于獲取至少一個(gè)源文本;
目標(biāo)語(yǔ)言指定模塊,用于獲取至少一個(gè)目標(biāo)語(yǔ)言;
摘要生成模塊,用于將至少一個(gè)源文本和與各所述目標(biāo)語(yǔ)言匹配的指示信息輸入到預(yù)先訓(xùn)練的摘要生成模型中,所述摘要生成模型用于將至少一個(gè)第一文本簡(jiǎn)化為至少一個(gè)第二文本,同時(shí)將各所述第一文本對(duì)應(yīng)的第一語(yǔ)言集合中的語(yǔ)言分別翻譯成第二語(yǔ)言集合中的至少一個(gè)語(yǔ)言,并分別作為各所述第二文本對(duì)應(yīng)的語(yǔ)言,所述第一語(yǔ)言集合包括多個(gè)語(yǔ)言,所述第一語(yǔ)言集合包括各所述源文本分別對(duì)應(yīng)的待翻譯語(yǔ)言;所述第二語(yǔ)言集合包括多個(gè)語(yǔ)言,所述第二語(yǔ)言集合包括各所述目標(biāo)語(yǔ)言;
摘要文本獲取模塊,用于獲取所述摘要生成模型輸出的分別與各所述目標(biāo)語(yǔ)言對(duì)應(yīng)的摘要文本。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010188547.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





