[發明專利]基于文本的判斷題生成方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011486652.2 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112507663A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 陳杭;賴眾程;倪佳;張舒婷;林志超;史文鑫;何鳳連;李驍;李筱藝;李會璟;賴幸斌;林嘉喜 | 申請(專利權)人: | 平安銀行股份有限公司 |
| 主分類號: | G06F40/117 | 分類號: | G06F40/117;G06F40/289;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 文本 判斷 生成 方法 裝置 電子設備 存儲 介質 | ||
本發明涉及人工智能技術,揭露了一種基于文本的判斷題生成方法,包括:構建及訓練包括特征轉化層、詞性標注層及分詞層的詞性標注及分詞模型,利用所述特征轉化層將原始文本集轉化為文本特征集,利用所述詞性標注層對所述文本特征集執行詞性標注得到詞性特征集,利用所述分詞層對所述詞性特征集執行分詞操作,得到詞語特征集,對所述詞語特征集執行權重劃分,得到詞語權重集,對所述詞語權重集執行部分遮蔽操作,得到遮蔽詞語集,將所述遮蔽詞語集輸入至預構建的判斷題生成模型,生成判斷題集。本發明還提出一種基于文本的判斷題生成裝置、電子設備以及一種計算機可讀存儲介質。本發明可以解決生成的判斷題可閱讀性差、準確率低的問題。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種基于文本的判斷題生成方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
目前基于文本自動生成判斷題的方法流程主要是:先對文本的句法結構進行解析得到句法結構,然后依據句法結構對句子進行拆分得到拆分詞語,通過拆分詞語的替換操作及拼接操作,生成判斷題。
上述方法雖然可實現判斷題的自動生成,但通過拆分詞語的替換操作及再拼接,生成的判斷題較為生硬,可閱讀性差,其次,由于句法結構解析一般使用當前已公開的貪心決策動作拼裝句法樹、PCFG及Lexical PCFG等算法,解析準確率不高,因此會較大影響生成判斷題的質量。
發明內容
本發明提供一種基于文本的判斷題生成方法、裝置、電子設備及計算機可讀存儲介質,其主要目的在于解決生成的判斷題可閱讀性差、準確率低的問題。
為實現上述目的,本發明提供的一種基于文本的判斷題生成方法,包括:
構建及訓練詞性標注及分詞模型,其中所述詞性標注及分詞模型包括特征轉化層、詞性標注層及分詞層;
接收原始文本集,利用所述特征轉化層將所述原始文本集轉化為文本特征集;
利用所述詞性標注層對所述文本特征集執行詞性標注,得到詞性特征集;
利用所述分詞層計算所述詞性特征集的分詞概率集,根據所述分詞概率集,對所述詞性特征集執行分詞操作,得到詞語特征集;
對所述詞語特征集執行權重劃分,得到詞語權重集;
對所述詞語權重集執行部分遮蔽操作,得到遮蔽詞語集;
將所述遮蔽詞語集輸入至預構建的判斷題生成模型,生成判斷題集。
可選地,所述構建及訓練詞性標注及分詞模型包括:
接收訓練文本集與所述訓練文本集對應的詞性標簽集,將所述訓練文本集執行替換及遮蔽操作,得到半遮蔽文本集;
構建詞性標注及分詞模型,利用所述詞性標注及分詞模型計算所述半遮蔽文本集的詞性預測集;
計算所述詞性預測集與所述詞性標簽集的差異值,當所述差異值大于或等于預設閾值時,調整所述詞性標注及分詞模型的內部參數,直至所述差異值小于所述預設閾值,得到訓練完成的詞性標注及分詞模型。
可選地,所述利用所述詞性標注及分詞模型計算所述半遮蔽文本集的詞性預測集,包括:
利用所述特征轉化層將所述半遮蔽文本集轉化為半遮蔽向量集;
利用所述詞性標注層,對所述半遮蔽向量集執行詞性預測,得到所述詞性預測集。
可選地,所述利用所述分詞層計算所述詞性特征集的分詞概率集,包括:
將所述詞性特征集轉變為固定維度的詞性向量集;
計算所述詞性向量集中每個詞性向量的分詞概率,并匯總每個詞性向量的分詞概率得到所述分詞概率集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安銀行股份有限公司,未經平安銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011486652.2/2.html,轉載請聲明來源鉆瓜專利網。





