[發明專利]基于圖譜的文本生成方法、系統、電子設備及存儲介質在審
| 申請號: | 202011417808.1 | 申請日: | 2020-12-07 |
| 公開(公告)號: | CN112559761A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 薛小娜;黃艷香 | 申請(專利權)人: | 上海明略人工智能(集團)有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/166;G06F40/186 |
| 代理公司: | 青島清泰聯信知識產權代理有限公司 37256 | 代理人: | 趙燕 |
| 地址: | 200030 上海市徐匯區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 圖譜 文本 生成 方法 系統 電子設備 存儲 介質 | ||
1.一種基于圖譜的文本生成方法,其特征在于,包括:
三元組排序步驟,基于一預設排序規則對構成圖譜的三元組進行排序;
冗余處理步驟,去除排序后的所述三元組的冗余信息,并基于一預設重組規則對所述三元組進行修改重組;
文本生成步驟,分析修改重組后的所述三元組的關系詞詞性,并根據分析結果通過一預設文本模板生成文本。
2.如權利要求1所述的基于圖譜的文本生成方法,其特征在于,所述三元組排序步驟包括:
有向圖構建步驟,將所述三元組進行去重,并轉換為一有向圖結構;
規則排序步驟,計算所述有向圖的出入度信息,并根據所述出入度信息和三元組間的上下文信息對所述三元組進行排序。
3.如權利要求2所述的基于圖譜的文本生成方法,其特征在于,所述規則排序步驟包括:先根據所述有向圖圖中各節點的出入度預先確定每個句子的起始三元組,再確定所述每個句子內所包含的其他三元組并確定所述每個句子內的三元組順序,最后確定所述每個句子的順序。
4.如權利要求1所述的基于圖譜的文本生成方法,其特征在于,所述冗余處理步驟包括,將所述三元組中冗余的共享實體替換為代詞或空字符串。
5.一種基于圖譜的文本生成系統,其特征在于,包括:
三元組排序單元,基于一預設排序規則對構成圖譜的三元組進行排序;
冗余處理單元,去除排序后的所述三元組的冗余信息,并基于一預設重組規則對所述三元組進行修改重組;
文本生成單元,分析修改重組后的所述三元組的關系詞詞性,并根據分析結果通過一預設文本模板生成文本。
6.如權利要求5所述的基于圖譜的文本生成系統,其特征在于,所述三元組排序單元包括:
有向圖構建模塊,將所述三元組進行去重,并轉換為一有向圖結構;
規則排序模塊,計算所述有向圖的出入度信息,并根據所述出入度信息和三元組間的上下文信息對所述三元組進行排序。
7.如權利要求6所述的基于圖譜的文本生成系統,其特征在于,所述規則排序模塊包括:先根據所述有向圖圖中各節點的出入度預先確定每個句子的起始三元組,再確定所述每個句子內所包含的其他三元組并確定所述每個句子內的三元組順序,最后確定所述每個句子的順序。
8.如權利要求5所述的基于圖譜的文本生成系統,其特征在于,所述冗余處理單元包括,將所述三元組中冗余的共享實體替換為代詞或空字符串。
9.一種電子設備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1至4中任一項所述的基于圖譜的文本生成方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1至4中任一項所述的基于圖譜的文本生成方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海明略人工智能(集團)有限公司,未經上海明略人工智能(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011417808.1/1.html,轉載請聲明來源鉆瓜專利網。





