[發(fā)明專利]文本修辭句的生成方法、裝置、設備及可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010770699.5 | 申請日: | 2020-07-31 |
| 公開(公告)號: | CN111914568A | 公開(公告)日: | 2020-11-10 |
| 發(fā)明(設計)人: | 崔艷;陳曦;李薿;莊伯金;王少軍 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市世紀恒程知識產(chǎn)權代理事務所 44287 | 代理人: | 陳小娟 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 修辭 生成 方法 裝置 設備 可讀 存儲 介質(zhì) | ||
1.一種文本修辭句的生成方法,其特征在于,所述文本修辭句的生成方法包括以下步驟:
基于知識抽取模型,抽取樣本語句中具有修辭關系的第一詞語和第二詞語;
識別所述樣本語句中的多個關鍵詞,并根據(jù)多個所述關鍵詞,將所述第一詞語和所述第二詞語形成為圖結(jié)構;
將所述圖結(jié)構構建為知識圖譜,并基于所述知識圖譜生成文本生成模型;
當接收到文本生成指令時,基于所述文本生成模型生成文本修辭句。
2.如權利要求1所述的文本修辭句的生成方法,其特征在于,所述根據(jù)多個所述關鍵詞,將所述第一詞語和所述第二詞語形成為圖結(jié)構的步驟包括:
將多個所述關鍵詞分別與所述第一詞語進行相似度計算,獲得多個第一相似度值;
將多個所述關鍵詞分別與所述第二詞語進行相似度計算,獲得多個第二相似度值;
查找多個所述第一相似度值中大于預設閾值的第一目標相似度值,以及多個所述第二相似度值中大于預設閾值的第二目標相似度值;
確定與所述第一目標相似度值對應的第一關鍵詞,以及與所述第二目標相似度值對應的第二關鍵詞;
當所述第一關鍵詞和所述第二關鍵詞相同時,將所述第一關鍵詞和所述第一詞語,以及第二詞語一并形成為圖結(jié)構。
3.如權利要求1所述的文本修辭句的生成方法,其特征在于,所述基于知識抽取模型,抽取樣本語句中具有修辭關系的第一詞語和第二詞語的步驟包括:
將所述樣本語句傳輸?shù)街R抽取模型,基于所述知識抽取模型抽取所述樣本語句中的實體詞語;
查找各所述實體詞語中滿足先驗關系的待驗證詞語對,并確定與各所述待驗證詞語對中每一詞語對應的關系概率;
根據(jù)各所述關系概率之間的大小關系,確定各所述待驗證詞語對中的目標詞語對,其中所述目標詞語對中包含第一詞語和所述第二詞語。
4.如權利要求3所述的文本修辭句的生成方法,其特征在于,所述基于所述知識抽取模型抽取所述樣本語句中的實體詞語的步驟包括:
基于所述知識抽取模型的字編碼模塊,確定所述樣本語句中各個字的字編碼,并將各個所述字編碼排列為句子編碼;
基于所述知識抽取模型的預設層對所述句子編碼進行打分處理,得到所述樣本語句中每個字的分數(shù),并根據(jù)所述樣本語句中每個字的分數(shù),確定所述樣本語句中的實體詞語。
5.如權利要求4所述的文本修辭句的生成方法,其特征在于,所述確定與各所述待驗證詞語對中每一詞語對應的關系概率的步驟包括:
根據(jù)各所述實體詞語在所述樣本語句中的實體位置,確定各所述實體詞語的實體編碼,并將各所述實體編碼轉(zhuǎn)換為實體編碼向量;
確定所述樣本語句中除各所述實體詞語之外的非實體詞語,并根據(jù)各所述非實體詞語在所述樣本語句中的非實體位置,對各所述實體編碼向量進行補全,獲得與所述句子編碼對應的向量序列;
基于所述知識抽取模型中的隱藏層輸出、所述句子編碼、所述向量序列、所述實體編碼向量,確定與各所述待驗證詞語對中每一詞語對應的關系概率。
6.如權利要求1-5任一項所述的文本修辭句的生成方法,其特征在于,所述當接收到文本生成指令時,基于所述文本生成模型生成文本修辭句的步驟包括:
當接收到文本生成指令時,獲取所述文本生成指令中的本體名詞以及修辭類型信息;
根據(jù)所述文本生成模型,確定與所述修辭類型信息對應的目標知識圖譜;
基于所述目標知識圖譜,確定與所述本體名詞對應的目標圖結(jié)構,并基于所述目標圖結(jié)構生成所述文本修辭句。
7.如權利要求7所述的文本修辭句的生成方法,其特征在于,所述基于所述目標圖結(jié)構生成所述文本修辭句的步驟包括:
確定所述文本生成指令對應的句子類型,若所述句子類型為完整類型,則基于所述目標圖結(jié)構生成句義完整的所述文本修辭句;
若所述句子類型為槽位類型,則基于所述目標圖結(jié)構生成具有槽位的所述文本修辭句,以及與各所述槽位對應的參考詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010770699.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





