[發(fā)明專利]古詩關(guān)鍵詞提取、詩句生成方法、裝置、設(shè)備及介質(zhì)有效
| 申請?zhí)枺?/td> | 202010738707.8 | 申請日: | 2020-07-28 |
| 公開(公告)號: | CN111859916B | 公開(公告)日: | 2023-07-21 |
| 發(fā)明(設(shè)計)人: | 劉廣 | 申請(專利權(quán))人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/284;G06F40/289;G06F40/117;G06F40/242 |
| 代理公司: | 深圳眾鼎專利商標(biāo)代理事務(wù)所(普通合伙) 44325 | 代理人: | 譚果林 |
| 地址: | 518000 廣東省深圳市福田*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 古詩 關(guān)鍵詞 提取 詩句 生成 方法 裝置 設(shè)備 介質(zhì) | ||
本發(fā)明涉及大數(shù)據(jù)的數(shù)據(jù)處理領(lǐng)域,提供一種古詩關(guān)鍵詞提取、詩句生成方法、裝置、設(shè)備及介質(zhì),方法包括:獲取詩句提取指令中的詩句信息;將詩句信息輸入古詩關(guān)鍵詞提取模型中基于BERT和古文字典的詩句標(biāo)注模型中,通過詩句標(biāo)注模型對詩句信息進(jìn)行拆分及標(biāo)注處理,得到詩句序列信息;通過詩句類型識別模型識別出詩句類型;將詩句序列信息輸入古詩關(guān)鍵詞提取模型中與詩句類型對應(yīng)的基于CRF的類型約束模型,通過對各詩字序列信息之間進(jìn)行打標(biāo)及約束預(yù)測處理,得到關(guān)鍵詞結(jié)果;根據(jù)關(guān)鍵詞結(jié)果,確定古詩關(guān)鍵詞。本發(fā)明實現(xiàn)通過基于BERT和古文字典的詩句標(biāo)注模型以及基于CRF的類型約束模型,自動提取詩句信息中的體現(xiàn)詩意的古詩關(guān)鍵詞。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)的數(shù)據(jù)處理領(lǐng)域,尤其涉及一種古詩關(guān)鍵詞提取、詩句生成方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)。
背景技術(shù)
目前,人工智能已實現(xiàn)自動生成詩句,大多數(shù)都是通過一個關(guān)鍵詞生成一個詩句,即生成五言或七言詩句,在現(xiàn)有技術(shù)中,往往是通過基于深度學(xué)習(xí)的作詩模型生成詩句,該技術(shù)方案就需要大量的詩句樣本,而現(xiàn)在的可用于訓(xùn)練作詩模型的詩句樣本十分缺少,并且由于未對詩句樣本進(jìn)行詩意提取關(guān)鍵詞,導(dǎo)致訓(xùn)練完成的作詩模型擬合程度不高,通過該作詩模型生成的詩句往往缺乏詩句樣本的詩意,也會存在句子不連貫等各種問題,從而導(dǎo)致生成的詩句給用戶的滿意度低,體驗度差等現(xiàn)象。
發(fā)明內(nèi)容
本發(fā)明提供一種古詩關(guān)鍵詞提取、詩句生成方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì),實現(xiàn)了通過基于BERT和古文字典的詩句標(biāo)注模型以及基于CRF的類型約束模型,自動提取詩句信息中的體現(xiàn)詩意的古詩關(guān)鍵詞,達(dá)到對詩句信息進(jìn)行文本增強(qiáng)的效果,提高了訓(xùn)練詩句生成模型的生成準(zhǔn)確率,同時通過IF-IDF算法提取文本信息中的文本關(guān)鍵詞,并通過詩句生成模型生成符合詩意的詩句,提高了用戶的滿意度和體驗度。
一種古詩關(guān)鍵詞提取方法,包括:
接收到詩句提取指令,獲取所述詩句提取指令中的詩句信息;
將所述詩句信息輸入古詩關(guān)鍵詞提取模型中基于BERT和古文字典的詩句標(biāo)注模型中,通過所述詩句標(biāo)注模型對所述詩句信息進(jìn)行拆分及標(biāo)注處理,得到詩句序列信息;所述詩句序列信息包括多個詩字序列信息;
通過所述古詩關(guān)鍵詞提取模型中的詩句類型識別模型識別出與所述詩句信息匹配的詩句類型;
將所述詩句序列信息輸入所述古詩關(guān)鍵詞提取模型中與所述詩句類型對應(yīng)的基于CRF的類型約束模型,通過與所述詩句類型對應(yīng)的所述類型約束模型對各所述詩字序列信息進(jìn)行打標(biāo)及約束預(yù)測處理,得到關(guān)鍵詞結(jié)果;其中,一個所述詩句類型對應(yīng)一個所述類型約束模型;
獲取所述古詩關(guān)鍵詞提取模型根據(jù)所述關(guān)鍵詞結(jié)果輸出的最終關(guān)鍵詞,將所述最終關(guān)鍵詞確定為所述詩句信息的古詩關(guān)鍵詞。
一種詩句生成方法,包括:
接收到生成指令,獲取所述生成指令中的文本信息;
通過IF-IDF算法,提取出所述文本信息中的文本關(guān)鍵詞;
將所述文本關(guān)鍵詞輸入通過關(guān)鍵詞樣本進(jìn)行訓(xùn)練獲得的詩句生成模型,得到詩句生成結(jié)果;所述詩句生成結(jié)果確定為根據(jù)所述文本信息生成的詩句;所述關(guān)鍵詞樣本為通過上述古詩關(guān)鍵詞提取方法對所述關(guān)鍵詞樣本關(guān)聯(lián)的所述詩句標(biāo)簽進(jìn)行處理獲得。
一種古詩關(guān)鍵詞提取裝置,包括:
接收模塊,用于接收到詩句提取指令,獲取所述詩句提取指令中的詩句信息;
拆分模塊,用于將所述詩句信息輸入古詩關(guān)鍵詞提取模型中基于BERT和古文字典的詩句標(biāo)注模型中,通過所述詩句標(biāo)注模型對所述詩句信息進(jìn)行拆分及標(biāo)注處理,得到詩句序列信息;所述詩句序列信息包括多個詩字序列信息;
匹配模塊,用于通過所述古詩關(guān)鍵詞提取模型中的詩句類型識別模型識別出與所述詩句信息匹配的詩句類型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國平安人壽保險股份有限公司,未經(jīng)中國平安人壽保險股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010738707.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 關(guān)鍵詞輸出設(shè)備和關(guān)鍵詞輸出方法
- 用于選擇用于網(wǎng)絡(luò)發(fā)布的關(guān)鍵詞的方法和設(shè)備
- 關(guān)鍵詞質(zhì)量度的檢測方法和裝置
- 關(guān)鍵詞排名的檢測方法和裝置
- 關(guān)鍵詞相似度獲取方法、裝置及服務(wù)器
- 關(guān)鍵詞推薦方法及裝置
- 一種關(guān)鍵詞檢索管理系統(tǒng)
- 一種信息推薦方法、電子設(shè)備、存儲介質(zhì)及系統(tǒng)
- 關(guān)鍵詞廣告投放自動化否定關(guān)鍵詞方法及裝置
- 一種長尾關(guān)鍵詞識別方法、關(guān)鍵詞搜索方法及計算機(jī)設(shè)備





