[發明專利]相似文本生成方法、裝置、設備及存儲介質在審
| 申請號: | 201910315374.5 | 申請日: | 2019-04-18 |
| 公開(公告)號: | CN110147535A | 公開(公告)日: | 2019-08-20 |
| 發明(設計)人: | 金戈;徐亮 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22;G06N3/04 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 胡海國 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 生成式 概率 文本生成器 存儲介質 文本生成 預設 對抗 目標文本 輸出條件 網絡模型 文本鑒別 文本結果 優化策略 語義解析 鑒別器 檢測 優化 網絡 保證 計算機 | ||
本發明涉及語義解析技術領域,公開一種相似文本生成方法、裝置、設備及存儲介質,該方法通過將初始文本輸入至生成式對抗網絡中的文本生成器以獲取相似文本,并將生成的相似文本和用戶輸入的初始文本輸入至生成式對抗網絡的文本鑒別器中計算文本之間的當前判別概率,然后檢測該當前判別概率是否等于預設概率值,若等于則將當前生成的相似文本作為目標文本,若不等于則根據預先設定的優化策略對文本生成器和文本鑒別器進行循環優化,直至獲取到的判別概率等于預設概率值,由于是對生成式對抗網絡模型進行循環優化并檢測模型文本結果是否滿足最終的輸出條件,從而能夠保證獲得的相似文本直接為計算機所理解,保證了文本輸入的準確性及可靠性。
技術領域
本發明涉及語義解析技術領域,尤其涉及一種相似文本生成方法、裝置、設備及存儲介質。
背景技術
采用自然語言寫成的輸入文本通常難以直接為計算機所理解,因此,在文本分類、文本翻譯等場合,通常需要采用深度學習模型根據輸入文本獲取到相似文本,以便于計算機對文本進行理解。在現有的深度學習模型中,生成式對抗網絡(Generative AdversarialNetworks,GAN)因能夠輸出準確度高的結果,在圖像生成等領域受到廣泛的重視,生成式對抗網絡的架構通常包括生成器(Generator)和鑒別器(Discriminator),二者互相博弈學習產生相當好的輸出。
目前,雖然GAN模型已經被應用到文本數據的語義解析領域,但由于GAN模型本身的自由性,對于文本這一類離散序列數據而言,該模型的穩定性仍十分不足,經常會導致模型最終輸出的文本結果不理想。
發明內容
本發明的主要目的在于提供了一種相似文本生成方法、裝置、設備及存儲介質,旨在解決生成式對抗網絡在處理文本類數據時,最終輸出的文本結果不理想的技術問題。
為實現上述目的,本發明提供了一種相似文本生成方法,所述方法包括以下步驟:
將當前獲取到的初始文本輸入至當前文本生成器,以使所述當前文本生成器根據所述初始文本生成并輸出當前相似文本;
將所述初始文本和所述當前相似文本輸入至當前文本鑒別器,以使所述當前文本鑒別器根據所述當前相似文本獲取對應的當前判別概率;
檢測所述當前判別概率是否等于預設概率值,若不等于,則根據預設模型優化策略對所述當前文本生成器以及所述當前文本鑒別器進行模型優化,以獲得優化后的文本生成器和優化后的文本鑒別器;
將優化后的文本生成器作為新的當前文本生成器,將優化后的文本鑒別器作為新的文本鑒別器,并返回至所述將當前獲取到的初始文本輸入至當前文本生成器的步驟;
循環檢測獲取到的當前判別概率是否等于所述預設概率值,若等于,則將所述當前相似文本作為目標相似文本。
優選的,所述當前文本生成器為第一卷積神經網絡,所述第一卷積神經網絡包括第一輸入層和至少一個第一卷積層;
所述將當前獲取到的初始文本輸入至當前文本生成器,以使所述當前文本生成器根據所述初始文本生成并輸出當前相似文本的步驟,包括:
將當前獲取到的初始文本輸入至所述第一輸入層,以使所述第一輸入層對所述初始文本進行向量轉化,獲得第一文本向量;
將所述第一文本向量輸入至所述第一卷積層,以使所述第一卷積層對所述第一文本向量進行文本特征提取,以獲取詞匯隱變量;
通過第一映射函數對所述詞匯隱變量進行變量篩選,并將篩選結果作為當前相似文本。
優選的,所述將當前獲取到的初始文本輸入至所述第一輸入層,以使所述第一輸入層對所述初始文本進行向量轉化,獲得第一文本向量的步驟,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910315374.5/2.html,轉載請聲明來源鉆瓜專利網。





