[發(fā)明專(zhuān)利]摘要生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審

申請(qǐng)?zhí)枺?/td>	202010188547.4	申請(qǐng)日：	2020-03-17
公開(kāi)（公告）號(hào)：	CN111400454A	公開(kāi)（公告）日：	2020-07-10
發(fā)明（設(shè)計(jì)）人：	王明軒;李磊	申請(qǐng)（專(zhuān)利權(quán)）人：	北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司
主分類(lèi)號(hào)：	G06F16/33	分類(lèi)號(hào)：	G06F16/33;G06F16/35;G06F40/30;G06F40/58;G06N3/04;G06N3/08;G06N20/00
代理公司：	北京遠(yuǎn)智匯知識(shí)產(chǎn)權(quán)代理有限公司 11659	代理人：	范坤坤
地址：	100041 北京市石景山區(qū)***	國(guó)省代碼：	北京;11
權(quán)利要求書(shū)：	查看更多	說(shuō)明書(shū)：	查看更多
摘要：
搜索關(guān)鍵詞：	摘要生成方法裝置電子設(shè)備存儲(chǔ) 介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會(huì) 專(zhuān)利詞庫(kù) 專(zhuān)利權(quán)人專(zhuān)利榜在售專(zhuān)利公布日期熱門(mén)專(zhuān)利

【權(quán)利要求書(shū)】：

1.一種摘要生成方法，其特征在于，包括：

獲取至少一個(gè)源文本；

獲取至少一個(gè)目標(biāo)語(yǔ)言；

將至少一個(gè)源文本和與各所述目標(biāo)語(yǔ)言匹配的指示信息輸入到預(yù)先訓(xùn)練的摘要生成模型中，所述摘要生成模型用于將至少一個(gè)第一文本簡(jiǎn)化為至少一個(gè)第二文本，同時(shí)將各所述第一文本對(duì)應(yīng)的第一語(yǔ)言集合中的語(yǔ)言分別翻譯成第二語(yǔ)言集合中的至少一個(gè)語(yǔ)言，并分別作為各所述第二文本對(duì)應(yīng)的語(yǔ)言，所述第一語(yǔ)言集合包括多個(gè)語(yǔ)言，所述第一語(yǔ)言集合包括各所述源文本分別對(duì)應(yīng)的待翻譯語(yǔ)言，所述第二語(yǔ)言集合包括多個(gè)語(yǔ)言，所述第二語(yǔ)言集合包括各所述目標(biāo)語(yǔ)言；

獲取所述摘要生成模型輸出的分別與各所述目標(biāo)語(yǔ)言對(duì)應(yīng)的摘要文本。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述獲取至少一個(gè)源文本，包括：

獲取至少兩個(gè)源文本，各所述源文本對(duì)應(yīng)的待翻譯語(yǔ)言不同；

所述將至少一個(gè)源文本和與各所述目標(biāo)語(yǔ)言匹配的指示信息輸入到預(yù)先訓(xùn)練的摘要生成模型中，包括：

如果各所述源文本滿足語(yǔ)義相似條件，則將至少兩個(gè)源文本和與各所述目標(biāo)語(yǔ)言匹配的指示信息輸入到預(yù)先訓(xùn)練的摘要生成模型中。

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述獲取至少一個(gè)目標(biāo)語(yǔ)言，包括：

獲取至少兩個(gè)目標(biāo)語(yǔ)言，各所述目標(biāo)語(yǔ)言不同。

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述摘要生成模型為Seq2Seq模型，所述摘要生成模型包括編碼器和解碼器；其中，所述編碼器和所述解碼器的總數(shù)量為至少三個(gè)，不同編碼器對(duì)應(yīng)不同源文本，不同解碼器對(duì)應(yīng)不同目標(biāo)語(yǔ)言。

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述獲取所述摘要生成模型輸出的分別與各所述目標(biāo)語(yǔ)言對(duì)應(yīng)的摘要文本，包括：

通過(guò)所述摘要生成模型中的多個(gè)編碼器分別提取對(duì)應(yīng)的源文本中的源文本序列片段，并進(jìn)行融合編碼，形成所述源文本的目標(biāo)特征向量；

通過(guò)所述摘要生成模型中的解碼器根據(jù)所述目標(biāo)特征向量和所述目標(biāo)語(yǔ)言，將所述目標(biāo)特征向量映射為目標(biāo)語(yǔ)言的文本序列，作為摘要文本。

6.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述獲取所述摘要生成模型輸出的分別與各所述目標(biāo)語(yǔ)言對(duì)應(yīng)的摘要文本，包括：

通過(guò)所述摘要生成模型中的編碼器提取所述源文本中的源文本序列片段，并進(jìn)行編碼，形成所述源文本的目標(biāo)特征向量；

通過(guò)所述摘要生成模型中的多個(gè)解碼器分別根據(jù)各所述目標(biāo)語(yǔ)言，分別將所述目標(biāo)特征向量映射為文本序列，確定各所述解碼器對(duì)應(yīng)的摘要文本。

7.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述獲取所述摘要生成模型輸出的分別與各所述目標(biāo)語(yǔ)言對(duì)應(yīng)的摘要文本，包括：

8.一種摘要生成裝置，其特征在于，包括：

源文本獲取模塊，用于獲取至少一個(gè)源文本；

目標(biāo)語(yǔ)言指定模塊，用于獲取至少一個(gè)目標(biāo)語(yǔ)言；

摘要生成模塊，用于將至少一個(gè)源文本和與各所述目標(biāo)語(yǔ)言匹配的指示信息輸入到預(yù)先訓(xùn)練的摘要生成模型中，所述摘要生成模型用于將至少一個(gè)第一文本簡(jiǎn)化為至少一個(gè)第二文本，同時(shí)將各所述第一文本對(duì)應(yīng)的第一語(yǔ)言集合中的語(yǔ)言分別翻譯成第二語(yǔ)言集合中的至少一個(gè)語(yǔ)言，并分別作為各所述第二文本對(duì)應(yīng)的語(yǔ)言，所述第一語(yǔ)言集合包括多個(gè)語(yǔ)言，所述第一語(yǔ)言集合包括各所述源文本分別對(duì)應(yīng)的待翻譯語(yǔ)言；所述第二語(yǔ)言集合包括多個(gè)語(yǔ)言，所述第二語(yǔ)言集合包括各所述目標(biāo)語(yǔ)言；

摘要文本獲取模塊，用于獲取所述摘要生成模型輸出的分別與各所述目標(biāo)語(yǔ)言對(duì)應(yīng)的摘要文本。

下載完整專(zhuān)利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司，未經(jīng)北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010188547.4/1.html，轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。

同類(lèi)專(zhuān)利

專(zhuān)利分類(lèi)

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專(zhuān)利文獻(xiàn)下載

說(shuō)明：

1、專(zhuān)利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利說(shuō)明書(shū)；

2、支持發(fā)明專(zhuān)利、實(shí)用新型專(zhuān)利、外觀設(shè)計(jì)專(zhuān)利（升級(jí)中）；

3、專(zhuān)利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專(zhuān)利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】